Отправляет email-рассылки с помощью сервиса Sendsay

Новости лаборатории Наномир

  Все выпуски  

1316 Создаём программу Binary_SS для корреляционного анализа. Часть 13.


Выпуск 1316
2024-04-25

Лаборатория Наномир

Когда реальность открывает тайны,
уходят в тень и  меркнут чудеса ...

Создаём программу Binary_SS для корреляционного анализа.

Часть 13.

 Предыдущую часть см. в выпуске 1301

14 April 2024 11:38 Программист: Добрый день, Александр! Готова очередная версия программы. В новой версии можно в конфиге задать параметр writeInFile в секции [code4] и при расчете корреляции в каждой папке будет создан файл code4.txt с таблицей по коду-4.

По поводу псевдографики: пока что использую три и пять "тире", т.к. есть некоторая сложность с кодировками на windows. По идее, можно еще использовать символ жирной точки, он относительно близок в черному квадрату, с ним проблем не возникает.

∙ - вот такой. Он входит в кодировку ASCII и ANSI

У меня пока что не получилось сделать так, чтобы выходной файл для кода-4 был с кодировкой UTF8. Буду еще пробовать.

Пример создаваемого файла по коду-4: code4.txt 9.0 KB

 


11:44 Александр Кушелев: Отлично! 

11:45 Программист: code4.txt 9.0 KB

 

Такой же файл, но с использованием символа жирной точки

11:46 Александр Кушелев: А можно сделать чтение символов псевдографики из файла, чтобы можно было их менять и подыскивать удачные?

11:47 Программист: Чтобы в дальнейшем, например, 3 тире заменились на что-то?

аааа понял речь про конфиг

11:47 Александр Кушелев: Да. И другие символы тоже нужно менять

11:48 Программист: В конфиге задавать базовый символ.

11:48 Александр Кушелев: Именно строку символов

11:48 Программист: Да, это можно сделать через конфиг.

11:48 Александр Кушелев: Отлично! Надо сделать

11:48 Программист: Я внесу эти правки в ближайшее время

11:49 Александр Кушелев: Ок

11:52 Программист: А можете написать названия элементов 1-4 в коде-4 ?

1 - ...

2 - ...

...

Нужно их обозвать будет в конфиге, чтоб было понятно

11:54 Александр Кушелев: Пусть цифрами и обзываются

11:54 Программист: окей, тоже об этом думал, как вариант

11:55 Александр Кушелев: А пробелы между строчками и между символами в строке можно убрать?

11:55 Программист: можете на скрине показать какие ?

11:56 Александр Кушелев: Не, вроде всё и так норм

11:56 Программист: Просто если колонки лепить ближе друг к другу, то хуже получается, на мой вгляд. Я пробовал

11:57 Александр Кушелев: Ок

Может быть ещё попробовать вместо пробелов использовать горизонтальную табуляцию. И тоже через файл конфиг.

Чтобы не только в блокноте были ровные столбцы

12:04 Программист: А у Вас где-то неровно эта таблица открывается? Просто наоборот, использовать табуляцию однозначно нельзя! В разных системах табуляция может состоять из разного числа пробелов. где-то 4, где-то 8.. и все поплывет сразу. А пробел - он и в Африке пробел. занимает строго один символ.

12:06 Александр Кушелев: Ок

16:25 Программист: Александр, вот архив с новой версией

Binary_SS.rar 746.1 KB

Ещё не добавил, чтоб элементы псевдографики для кода-4 задавались в конфиге, пока-что там тире используются. Добавлю сегодня завтра и пришлю

16:26 Александр Кушелев: Спасибо!

15 April 2024 00:14 Александр Кушелев: А можно после столбца с псевдографикой по коду-4 выводить ещё столбец с псевдографикой по коду-1 (из фасты) и коду-1 (из ent)?

Ноль по умолчанию в ини-файле пусть будет пробел, а единица Ж

Программа на Си не может выводить символы в кодировке DOS?

Можно посмотреть полную таблицу символов, которую может выводить программа?

Шестнадцатеричный код чёрного прямоугольника в DOS = DB

ru.stackowerflow.com/questions/289383/Unicode-при-записи-в-файл

Здесь об’ясняют, как выводить Юникод в файл

Решение там в конце. В программе есть коммент: «Я тоже не знаю, почему в C/C++ всё так сложно»

04:31 Программист: Да, добавлю. В этом же файле или в отдельном выводить?

https://www.ascii-code.com/

С кодировками ещё буду разбираться, на c++, это действительно сделать не так просто, как хотелось бы. Проблемы именно в windows системах возникают. В Linux Unicode используется, что облегчает жизнь

09:05 Александр Кушелев: В этом же. Два дополнительных столбца таблицы. Может быть проще формировать не txt, a html? Тогда и цветная псевдографика легко получается. После 14 часов пришлю образец html

10:21 Программист: Ок. Хотел попробовать сначала наладить работу с кодировкой utf-8, тогда можно было бы много символов подбирать для задания псевдографики. Но если не получится, то придется html делать

10:24 Александр Кушелев: Ok

10:24 Программист: Но Вы все равно пришлите если что образец

10:34 Александр Кушелев: Ok

0732_KAJ9520018.1.html 96.8 KB

Такой html-файл делает программа в Матлабе, как альтернативу этой графике:


Но это - компактное представление. А нам будет нужно в первую очеред полное, т.е. такого типа:

 

0732_KAJ9520018.1.png 10.0 MB

Photo 174×1280

В первом графическом столбце - код-4

А вместо второго столбца нужен будет черно-белый код-1 по фасте и третий графический столбец - черно-белый код-1 по ent

code4_.txt 1.4 KB

Вероятно, нужно задавать не отдельные символы пседографики, а строки, соответствующие вариантам 1,2,3,4

Так же и с кодом-1

16 April 2024 08:40 Программист: Окей, так и буду делать

Ближе к концу недели скину результаты

11:46 Александр Кушелев: Благодарю!

20 April 2024 16:17 Программист: Здравствуйте, Александр!

Новая версия программы сделана.

Нововведения:

- в таблицу с информацией о коде-4 добавлен вывод кода-1 для fasta и pdb/ent;

- добавлена возможность в файле конфигурации задавать значения псевдографики для элементов кода-1 и кода-4.

Для элементов псевдографики есть нюанс: можно задавать теперь символы юникода, черные квадраты и множество других на выбор. но лучше для элементов кода-4 не превышать количество символов более 5. Для кода-1 - не превышать количество более 1.

Иначе поплывет верстка таблицы.

Если для кода-1 будет нужно более одного символа задавать, то скорректируем это.

Так же и для кода-4, если будет нужда задавать более 5 символов - то можно поправить будет.

Но на данный момент программа сделана так, как я описал выше. Лучше не превышать эти ограничения на длину псевдографики, чтобы таблица выглядела ровной и красивой.

Повторюсь:

- псевдографика для кода-4 не более 5 символов;

- псевдографика для кода-1 не более 1 символа;

Вот пример файла, который формирует программа для папки 00001: code4.txt 15.2 KB

  

Такой результат был получен при вот таком конфиге:


Сразу предвижу вопрос по поводу выравнивания по центру столбца элементов псевдографики: с этим есть некоторая сложность... Это можно сделать, но довольно запарно, все дело в кодировках, если вкратце

Если это не критично, то хорошо... Если критично - буду думать, как это лучше реализовать.

подготовлю пока что архив с новой версией программы

16:50 Александр Кушелев: О! Класс! Надо будет попробовать получить удобную картинку с помощью этой версии программы. Может быть доработка и не понадобится.

А можно в качестве символов псеводграфики задавать пробелы?

Вы пишите: "получить вот такой проблемно"

Кушелев: Если эти символы набирать из 5 символов одинаковой ширины, то в чём проблема?

11111

01110

Единичками я обозначил чёрный прямоугольник, а нулями - белый.

Симметрию, вероятно, можно получить, если заменить более узкий чёрный прямоугольник на широкий, но серый.


Программа не может пробелы выводить?

17:18 Программист: Один пробел задать можно, нужно просто ничего не писать после знака '='. Например:

param =

А вот более одного, нет, кажется

Проблема в пробелах.. чтение конфига их обрежет, если не ошибаюсь. Сейчас не могу проверить, не около компьютера

Надо будет поэкспериментировать. Не уверен, что пробелы по краям получится через конфиг задать

Но, возможно, какие-то другие символы использовать получится. Типо по краям серые квадраты, в центре три черных

Voice message  846.7 KB

18:05 Александр Кушелев: А нельзя в программе заменять какой-нибудь символ на пробел? Например, ноль (0). В конфиге указывать нули, а программа их заменит на пробелы.

18:56 Программист: Так можно сделать

21 April 2024

07:50 Программист: Я правки с пробелами сделаю и напишу.

13:06 Александр Кушелев: А когда Вы планируете доделать превращение нулей в пробелы?

13:47 Программист: Вот только что закончил это делать, получилось. Сейчас покажу.

При вот таком конфиге:


получается такой результат:


Я тут экспериментировал с псевдографикой для элементов "2" и "3" в коде-4

21 April 2024

15:06 Александр Кушелев: Класс! Если можете прислать программу раньше, то будет очень здОрово. 

15:21 Программист: Окей, я сейчас программу пришлю

15:22 Александр Кушелев: Благодарю!

15:41 Программист: Binary_SS.rar 731.5 KB

Новая версия программы, в архив включил исполняемый файл и файл конфигурации

16:09 Александр Кушелев: Благодарю!

20:46 Александр Кушелев: 00130_code4.txt 15.5 KB

 

Добрый вечер, Роман!

Разбираюсь со странными результатами на примере 00130-ой папки.

Непонятно, откуда там взялись спиральные участки по фасте? Судя по коду-4 (первый столбец с псевдографикой) там спиралей нет.

Может быть так где-то переполнение произошло на 130-ом файле?

 

AAA36409_sum.png 205.1 KB

Код-4 псевдографика правильно отображается. А с кодом-1 что-то не то...

config.ini 4.0 KB

00001_code4.txt 14.3 KB

Для папки 00001 всё безупречно с кодом-1

Это значит какое-то переполнение происходит.

Вероятно, программа не обнуляет что-то при переоде к следующему белку.

00100_code4.txt 16.5 KB

В папке 00100 тоже некорректно показана псевдографика для кода-1

00050_code4.txt 8.8 KB 

Для папки 00050 всё корректно считается.

22 April 2024 04:41 Программист: Здравствуйте, Александр!

Код-1 для fasta выводится скорректированный по длине. То есть он подрезан, если был не равен по длине коду-1 из pdb. Это не может влиять?

А вообще, я подробнее гляну сегодня

Кстати, код-1 по pdb задействуется с укороченными спиралями(обрезан по единицам)

А код-1 из fasta - нет. Там он обрезается по единицам перед расчётом корреляции по нулям. А табличка кода-4 выводится раньше этого. То есть код-1-fasta не подрезан

08:53 Александр Кушелев: Ну так до 50-го файла вроде проблем нет. А после 100-го есть. Что-то переполняется…

11:44 Программист: Будем смотреть в чем дело

Разберемся обязательно.

12:57 Александр Кушелев: Ура!

24 April 2024 17:45 Александр Кушелев: Добрый день, Роман!

Есть ряд белков, для которых нет файлов PDB/ent, но есть вторичная структура: https://www.uniprot.org/uniprotkb/A0A1Q9E695/entry

Она даётся в таком формате:


Как бы нам добавить возможность работать с парами "fasta" и такой файл? Его можно сохранять в нужную папку в формате html.

Такие файлы будут очень убедительным аргументом для научной статьи, т.к. их структура будет коррелировать на 100%

Вот схема вторичной структуры этого белка по фасте: 

 

Вот ещё белок из этого класса:


Подробнее: http://nanoworld88.ru/files/700-800/718.htm

Идентификатор: OLP87597

https://www.uniprot.org/uniprotkb/A0A1Q9CXG9/entry

https://www.ncbi.nlm.nih.gov/protein/OLP87597.1

Это так называемые транс-мембранные белки, которые практически все имеют очень длинные спиральные участки, которые уже изучены "мокрыми методами".

Другие подробности: https://t.me/nanoworldlab/743

25 April 2024 04:38 Программист: Здравствуйте, Александр!

Скоро как-раз подходят праздничные дни, будет время подробнее изучить этот вопрос. Сейчас на работе у меня завал конкретный, времени практически нет свободного. А на праздниках, я перво-наперво гляну в чем проблема с кодом-1 для некоторых папок. И изучу информацию по транс-мембранным белкам.

10:06 Александр Кушелев: "в чем проблема с кодом-1 для некоторых папок"

-Для всех папок, начиная где-то с 00070-ой. Могу уточнить номер папки, с которой начинается проблема, если это поможет.

code4.txt 8.2 KB

На 65-ом белке видно, как псевдографика кода-1 "поехала" относительно псевдографики кода-4, который правильный для всех 200+ белков.

code4.txt 8.7 KB

На 64-ом белке ещё не "поехала"

Программа правильно отрабатывает 64 белка, а начиная с 65-го псевдографика по коду-1 начинает всё больше "съезжать".

00006_code4.txt 12.6 KB

Не, проблема всплывает уже на 6-ом белке (папка 00006)

00005_code4.txt 26.7 KB

И даже в 00005-ом.

00004_code4.txt

И даже в 00004-ом.

А в первых трёх белках проблем нет.

В белках 4,5,6,7 графика по коду-1 "съехала"

В 8,9 белках всё идеально.

В 10-ом код-1 "съехал" вверх на 2 позиции:

00010_code4.txt 8.2 KB

00011_code4.txt 1.1 KB

В белке 00011 код-1 не просто "съехал". Там даже длина "съехавшей" спирали увеличилась на единицу.

00012_code4.txt 11.9 KB

В белке 00012 всё идеально.

00013_code4.txt 17.4 KB

В белке 00013 код-1 совсем неправильный.

00014_code4.txt 9.2 KB

В белке 00014 всё идеально.

00015_code4.txt 21.4 KB

В белке 00015 код-1 неправильный.

Любопытно, что если код-1 правильный, то по всей структуре белка. А если неправильный, то тоже по всей структуре белка.

00016_code4.txt 3.9 KB

В белке 00016 код-1 "съехал" вверх на 1 позицию по всей длине белка.

00017_code4.txt 10.2 KB

В белке 00017 код-1 "съехал" вверх на 7 позиций по всей длине белка.

Это может означать не переполнение, а то, что номер позиции кода-1 не всегда увеличивается, поэтому код-1 и "съезжает"

Тут надо алгоритм проработать...

Как у Вас увеличивается индекс массива псевдографики для кода-1 ?

00018_code4.txt 2.7 KB

18-Идеально.

00019_code4.txt 8.3 KB

19 идеально

00020_code4.txt 6.4 KB

20 идеально.

00021_code4.txt 6.4 KB

21 Неправильно.

00022_code4.txt 18.7 KB

22 Идеально

00023_code4.txt 6.9 KB

23 Идеально

00024_code4.txt 7.0 KB

24 Идеально

00025_code4.txt 1.6 KB

25 Неправильно.

00026_code4.txt 10.0 KB

26 Идеально

00027_ code4.txt 18.5 KB

27 Идеально.

Не нашёл ни одной структуры, где было бы частичное смещение столбца псевдографики с кодом-1. Либо идеально, либо смещено/разрушено всё.

15:35 Программист: У меня есть предположение в чем дело, скорей всего, предположение верное. Обязательно проверю его

15:36 Александр Кушелев: Отлично!

15:36 Программист: Дело в обрезании кода-1 по длине

15:36 Александр Кушелев: Похоже на то

Хотя это может быть ещё не все проблемы :)

15:37 Программист: Не исключено, что ещё что-то обнаружится, но надеюсь, что нет

15:37 Александр Кушелев: Самое смешное, что для большого числа белков программа сработала корректно

Не будем торопить события.

15:37 Программист: Программа, думаю, сработала корректно для тех белков, для которых код-1 не подрезался по длине

15:38 Александр Кушелев: Понятно

15:39 Программист: Я думаю, что проблема уйдет, и мы сможем двигаться дальше по насущным вопросам

15:42 Александр Кушелев: ОК

Продолжение следует...

 


Приглашение к сотрудничеству

На базе научного открытия нами создан онлайн-сервис по определению структуры белковых молекул. Теперь мы сможем зарабатывать вместе.

По старой технологии определение одной структуры белка обходится примерно в 10 000 евро, а ждать нужно от 2 месяцев до 3 лет. По новой технологии структура определяется в 1000 раз точнее и в миллиард раз быстрее. 80% от найденного Вами заказа принадлежат Вам, как менеджеру.

Наш лозунг: "В 1000 раз лучше, в 1000^3 быстрее и в 1000 раз дешевле!"

Ваша задача заключается в размещении рекламы на онлайн-сервис белковых структур. Рынок этих структур очень большой и продолжает стремительно расти. Ежедневно кто-то оплачивает до 60 структур по средней цене 10 000 евро за штуку. Новая технология позволила на одном персональном компьютере за неделю определить структуры всех 115 000 белков человека, для которых известна нуклеотидная кодирующая последовательность. При этом качество результата, полученного по новой технологии в 1000 раз выше по точности, в миллиард раз по быстродействию и в 30 раз шире по номенклатуре белковых молекул. Единственное, что нам сегодня не хватает - рекламы.

Как получить Вашу первую зарплату менеджера? Найти заказчика белковых структур  и убедить его заказать за счёт лаборатории Наномир пробный заказ. Когда заказчик распробует новую технологию, он начнёт делать коммерческие заказы. С первого коммерческого заказа менеджер получает 80%. С последующих заказов процент будет постепенно уменьшаться, но с первого заказа другого заказчика менеджер снова получит 80%. Зарплата менеджера может достичь миллиона евро в день. И это не предел.


 

 

Инвестирование научных проектов

Приглашаем инвесторов и меценатов.

Как продвинуть цивилизацию на новый уровень своего развития и получить при этом огромные прибыли?

- Вложить деньги
в научные разработки.

Новейшие виды экологически чистых и мощных источников энергии, средство для продления жизни, 
высокие технологии.

Все это реально создать в ближайший год-два при наличии достаточного финансирования.


Готовые коммерческие продукты

 

1. Online service PROTEIN PICOTECHNOLOGY

2. Сверхдобротные одномодовые диэлектрические резонаторы в т.ч. с большим диапазоном перестройки

3. Станки для производства высокодобротных одномодовых резонаторов 

4. Технология изготовления сапфировых линз 

5. Магнитный тороидально-сферический конструктор

Проекты

01 Ruby Emdrive (Микроволновый двигатель без реактивной струи)

02 Ruby Power Source (Микроволновый источник энергии) 

03 Средство продления жизни (Возвращение молодости)

04 Октаэдрический редуктор

05 Шестеренчатая передача Кушелева

06 Магнитный подвес-стыковка-герметизация модулей

07 Ионно-микроволновый фрактальный излучатель

08 Гибкий отражатель из жестких элементов

09 Энциклопедия "Наномир"

10 Экспертиза

11 Конструктивные компьютерные игры

12 Интеллектуальный кодовый замок

13 Очки кругового обзора

14 Тетраэдрический сканер

15 Программируемая архитектура

16 Источник энергии промышленной частоты

17 Источник энергии постоянного тока

18 Монокристаллическая видеокамера

19 Система определения активных участков белка

20 Тераваттный лазер непрерывного действия

21 Бактериальный синтез алмазов

22 Шестеренчатые передачи с тремя степенями свободы

23 Сверхсветовая связь

24 Безосевая шестеренчатая передача

25 Aктивный язык программирования

26 Телевидение миллиметрового и оптического диапазонов

27 Микроволновая архитектура

28 Компьютерный экран из автономных элементов

29 Чтение / запись ДНК

30 Сверхсветовая локация / зрение

31 Нейтрализатор акустического сигнала

Коммерческое предложение: 

Виктория Соколик: Уважаемые коллеги, Вашему вниманию предоставляется услуга -- моделирование 2D и 3D структуры любого белка без ограничений в его размере и степени изученности с помощью программного обеспечения, базирующемся на принципиально новом подходе декодирования нуклеотидной последовательности, детерминирующей данный белок.

Всё, что необходимо от заказчика, это нуклеотидная последовательность мРНК интересующего его белка (или код этой нуклеотидной последовательности в EMBL, или хотя бы код самого белка в PDB).

В течение 1-3 суток мы готовы предоставить Вам схему вторичной структуры заказанного белка (2D), модель его пространственной структуры (3D) в виртуальном пространстве, а также файл .pdb с координатами каждого атома белка. 

Файл .pdb может быть использован по аналогии с файлами закристаллизованных белков из PDB банка для дальнейшего конформационного анализа белка методами молекулярной динамики с учётом физико-химической специфики микроокружения белка или его взаимодействия с лигандами.

Таким образом, Вы сможете максимально быстро удобным для Вас способом (по электронной почте, на сайте либо на электронном носителе) получить информацию о структуре Вашего белка.

 Сотрудничество может быть различным:

- участие в научных дискуссиях на форуме (конструктивное)

- совместное создание коммерческого продукта

- поиск инвесторов

- выступить менеджером по продаже готовых коммерческих продуктов 

- конструктивные предложения по продвижению идей лаборатории Наномир

- содействие в проведении экспериментов и т.п.

- написание совместных научных статей и т.п.

- материальный вклад (денежный или обеспечение оборудованием и материалами)

 

Пожалуйста, сообщайте о своем вкладе, чтобы мы зачли Вас как партнера лаборатории Наномир.

Telegram: https://t.me/nanoworldlab

Приглашение в группу: https://t.me/nanoworld_discussion 

WhatsApp: +7 926 850-54-22

mail: kushelev20120@yandex.ru


О способах финансирования можно спросить по электронной почте и на телеграм-канале. 

Огромное спасибо всем за помощь и поддержку! 


В избранное