Отправляет email-рассылки с помощью сервиса Sendsay

Новости лаборатории Наномир

  Все выпуски  

1345 Binary_SS сохраняет схемы в компактном и в развёрнутом представлении.


Выпуск 1345
2024-06-24

Лаборатория Наномир

Когда реальность открывает тайны,
уходят в тень и  меркнут чудеса ...

 Binary_SS сохраняет схемы в компактном и в развёрнутом представлении.

Предыдущая часть 

 

Компактное представление

 

 Развёрнутое представление (фрагмент)

Посмотреть целиком 

Важно, что вторичные схемы белков программа Binary_SS определяет примерно в 60 раз быстрее, чем программа Picotech, написанная в среде MatLab.

Обсуждение:

23 June 2024 11:25 Роман: Здравствуйте, Александр!

У меня есть первые результаты по формированию развернутых изображений с кодом-9(10). Сейчас скину пример.

00001_ECI1_YEAST.png 298.9 KB

Результат несколько отличается от картинок, что генерирует программа Валентина. У него код-9 отличается от кода-9, который формируется в Binary_SS. У него там больше значений, есть значения, например, 98, 97

00005_AAA60127.png 601.4 KB

вот еще результаты, для папок 00002-00005

00002_1433T_HUMAN.png 260.9 KB

00003_AAA33010.png 155.0 KB

00004_HS90A_HUMAN.png 244.4 KB

12:39 Александр Кушелев: Ну, больше значений нам не нужно. Они оказались лишними. Но нужно сделать замену графических символов для кода-10.

Если код-1(может встречаться и код 4) повторяется больше 3 раз, то становится кодом-5 (красный). Он изображается широким красным "кирпичом".

Если код-2 повторяется больше 2 раз, то становится кодом-8 (тёмно-зеленый)

Если код-3 повторяется больше 4 раз, то становится кодом-7 (синий). Он изображается широким синим кирпичом.


Должно быть так. Тёмно-зеленый кирпич нужно будет сделать таким же широким, как красный и синий. Тёмно-зеленый кирпич тоже должен появляться в том случае, если код 2 повторяется более 2 раз подряд. Кирпичи означают спираль. Если полного витка спирали нет, то и кирпича нет.

OLQ02947.fasta 2.7 KB

Давайте посмотрим, как должен выглядеть цветной код для 315-го белка...

Это - компактное представление: 

 

OLQ02947.png

У нас нумерация изменилась, поэтому и графические элементы для кода-10 тоже нужно поменять.


Фрагмент

Развёрнутое представление полностью 

Например, для синих кирпичей у нас номер поменялся с 3 на 7. Для красных - с 1 на 5. Для зеленых - с 2 на 8. Я имею в виду только код-10.


Красным цветом я показал код-10 по новому алгоритму. При этом кирпичи должны остаться такими.

13:18 Роман: Ну эти замены уже сделаны у нас... Код-10 формируется из кода-4 корректно, насколько я понимаю. Осталось разобраться с цветами блоков. Запутался с ними. Но лучше все же убедиться, что код-10 верно формируется. На примере какой-то папки.

13:19 Александр Кушелев: В коде-4 красный кирпич шёл под кодом-1, а в коде-10 будет идте под кодом-5. Синий кирпич в коде-4 шел под кодом-3, а в коде-10 будет идти под кодом-7. Зеленый кирпич (должен стать шире) в коде-4 шёл под кодом-2, а в коде-10 будет идти под кодом-8.

13:21 Роман: Это про широкие кирпичи речь, да?

13:21 Александр Кушелев: Код-10 формируется правильно. Это видно уже на компактном представлении. Да это про широкие кипричи речь. А узкие с широкими поменяются местами.

14:16 Роман: 00001_ECI1_YEAST.png 330.0 KB для папки 00001

14:21 Александр Кушелев: Отлчино! "Это меняет дело..." Теперь нужно тестировать...

14:21 Роман: сейчас пришлю архив.

14:23 Александр Кушелев: Отлично!

14:41 Роман: Binary_SS.rar 15.3 MB

Исполняемый файл, конфиг, библиотека opencv и папка с кирпичиками, она должна лежать в корне проекта, чтобы корректно все работало. Скорость работы при создании развернутой графики снизится, но, надеюсь, что в сравнении с matlab, все же будет относительно хорошей. Через конфиг можно регулировать, что нам нужно получить, только ли компактную графику, только ли развернутую, обе сразу. Или же еще и с расчетом корреляции до кучи.

14:46 Александр Кушелев: Благодарю! Сейчас попробую тестировать. В архиве только одна папка и три файла. А можете прислать все нужные для работы файлы? Из старых версий брать не хочется, чтобы не напутать...

14:53 Роман: А там только нужна папка data_for_correlation ещё и все. Конфиг, исполняемый файл, dll-файл библиотеки и папка с кирпичиками - всё что нужно.

14:53 Александр Кушелев: Это меняет дело!

Программа работает просто супер! А пока я её тестирую, хотелось бы спросить, нельзя ли цифры и буквы сделать более качественными? Какие-то они корявые. И для пролина нужно поменять графический элемент на жёлтый кирпич.

15:05 Роман: В OpenCV есть несколько вариантов шрифтов, можно попробовать использовать другие, но мне они ещё хуже показались... В теории, можно попробовать прикрутить какие-то другие шрифты, которые к OpenCV не относятся

15:06 Александр Кушелев: Может быть там есть более простой шрифт типа системного? Главное, чтобы легко читался.

15:08 Роман:

 

Вот этот, на этот ?

15:08 Александр Кушелев: Да

15:08 Роман: ок. Я сейчас создам примеры с несколькими шрифтами и скину сюда

15:10 Александр Кушелев: Спасибо!

15:30 Роман: 

FONT_HERSHEY_DUPLEX_05.png 323.7 KB

FONT_HERSHEY_PLAIN_08.png 267.5 KB

FONT_HERSHEY_SIMPLEX_05.png 310.3 KB

FONT_HERSHEY_TRIPLEX_05.png 347.4 KB

FONT_ITALIC_05.png 310.3 KB

FONT_HERSHEY_COMPLEX_05.png 339.3 KB

FONT_HERSHEY_COMPLEX_SMALL_06.png 304.8 KB

Вот несколько шрифтов, есть и другие, но они менее подходят, чем эти. Указано название шрифта и в конце его размер. "_05" - fontsize = 0.5, т.е. можно его меньше или больше сделать. Там в некоторых местах таблица поехала, не обращайте на это внимание

15:35 Александр Кушелев: FONT_ITALIC_05.png 148.5 KB

Этот лучше всего. Italic

15:36 Роман: Окей, тогда на него переделаю, таблицу выровняю.

15:36 Александр Кушелев: Отлично!

Развёрнутое представление тоже делается раз в 60 быстрее, чем на матлабе

15:37 Роман: А на матлаб регулируется, через конфиг, что хотим создать? или скопом все создается?

15:38 Александр Кушелев: Там только скопом. Но матлаб нам уже не нужен. "Гора с плеч" :)

15:38 Роман: Если честно, у меня есть мысли, почему может так медленно работать прога на матлаб

15:38 Александр Кушелев: Там интерпретатор.

15:38 Роман: Я конечно код внимательно не смотрел, но, не исключаю, что там Валентин мог не совсем оптимально работать с "кирпичиками".

15:39 Александр Кушелев: Всё, матлаб забыли, как кошмарный сон. Интерпретаторы тормозят везде и во всём. Работаем только с С++

15:40 Роман: Да, C++ все же в этом плане быстрее будет.

15:40 Александр Кушелев: Очень быстрее. В 60 раз - это "небо и земля".

15:41 Роман: В теории, даже это не предел. Есть мысли, как это можно еще ускорить, если возникнет такая нужда.

15:41 Александр Кушелев: Следующая версия - добавление 3D модуля. А с быстродействием пока ОК. Вы с 3D Studio не сталкивались?

15:42 Роман: Ни разу не сталкивался.

15:43 Александр Кушелев: Я написал скрипт Кушелева, который строит 3D модель по коду-4. Скрипт очень простой. Формула и ещё пара строк. Нам нужно будет начать с такого же простого модуля, который позволит быстро(!) строить модели самых крупных белков. Сейчас покажу этот скрипт, и Вам будет понятно, как всё просто.

15:44 Роман: окей

16:05 Александр Кушелев: На самом деле нам этот скрипт не нужен. Нам нужно преобразовать код-4 в массив друхгранных углов, по которому стандартный браузер белковых структур сам покажет пространственную модель. Давайте посмотрим, как выглядит файл двухгранных углов.

16:23 Александр Кушелев: Что-то не удаётся мне найти программу, которая читает структуры белков в формате двухгранных углов. Придётся отложить этот разговор, пока не надётся программа и стандарт файла.

16:25 Роман: Я пока-что шрифты поменяю, выровняю вёрстку таблицы и блок для пролина поменяю.

16:27 Александр Кушелев: Я нашёл программу, которая может читать координаты и двухгранные углы: https://sourceforge.net/projects/molmol/

Нам нужно сохранять файл двухгранных углов, который фактически является перекодировкой кода-4 в стандарте этой программы. Попробую найти в своих архивах эту программу: https://pubmed.ncbi.nlm.nih.gov/9367762/

Она точно может просматривать структуры в формате двухгранных углов. 3D модуль программы Binary_SS должен будет код-4 переформатировать в пары двухгранных углов. Таблица у меня тоже есть в архиве. Так что задача проще, чем казалась вначале. Главное - понять формат файла двухгранных углов.

16:58 Александр Кушелев: Что-то не могу найти стандарта двухгранных (торсионных) углов. Так что пока откладываем...

17:19 Роман: Binary_SS.rar 66.3 KB

версия программы со шрифтом italic + исправлен кирпич для пролина

окей

17:50 Александр Кушелев: Благодарю!

19:31 Александр Кушелев: Я нашёл у себя в архиве программу Molmol, которая может читать и сохранять не только файлы PDB, но и файлы двухгранных (торсионных) углов, ang

WindowsMolMol-V1.0.6.zip 2.6 MB

Я распаковал архив, запустил программу Molmol.exe

Открыл файл PDB: 1117_THU49596_frag.pdb 57.9 KB

Потом сохранил модель в формате двухгранных (торсионных) углов:

ff.ang 6.4 KB

А потом решил его снова открыть в программе Molmol. В результате программа показала деформированную модель, т.е. она работает некорректно. Сохраняет неправильные углы. Тем не менее, формат двухгранных (торсионных) углов стал понятен: frag.txt 6.4 KB

# Structure of 1117_THU49596_frag from MOLMOL

1 LEU CHI1 120.784 CHI2 120.249 PSI -84.894

2 ARG+ PHI -34.176 CHI1 117.159 CHI2 -3.525 CHI3 0.998

CHI4 114.209 PSI -84.880

3 GLY PHI -34.097 PSI -75.792

4 LEU PHI -60.555 CHI1 120.772 CHI2 120.216 PSI -84.910

5 PRO OMEGA 36.721 PSI -84.927

6 ALA PHI -34.075 PSI -84.938

7 CYS PHI -34.142 CHI1 120.775 PSI -84.874

...

В первом столбце мы видим номер аминокислотного остатка. Во втором трёхбуквенное название аминокислотного остктка, затем углы хи1 (CHI1), хи2 (CHI2), пси (PSI). А у второго остатка первый угол фи (PHI). У первого остатка он не даётся, т.к. его физически нет у первого остатка. Нам нужно будет сохранять пары углов PHI и PSI. Остальное - по шаблону. В папке с программой нужно будет иметь таблицу перекодировки кода-4 в углы PHI, PSI. Примерно такую:

     PHI PSI

1 -60 -45

2 60 30

3 120 70

4 -50 -25

Важно, чтобы таблица была записана именно в файле, чтобы я мог её редактировать в процессе настройки программы. А дальше всё просто. Программа Binary_SS вычисляет код-4. По коду-4 нужно сформировать массивs углов PHI и PSI. А дальше нужно вывести файл в этом формате: ff.ang 6.4 KB

В первом столбце должен быть номер аминокислотного остатка. Во втором - трёхбуквенный код аминокислотного остатка. В третьем должны быть символы PHI. В чётвертом должно быть значение PHI из массива. В пятом должны быть симмолы PSI. В шестом - значение PSI из массива.

Формат, конечно, дурацкий. Там после PHI написаны углы CHI1...CHI4, которые придётся брать из шаблона для каждого аминокислотного остатка. Эти углы относятся к боковым ветвям аминокислот. Нам их вычислать не нужно. Они все известны. Но вписывать их в шаблон придётся, иначе программа Molmol не сможет прочесть файл. Она для каждого аминокислотного остатка читает строку по соответствующему шаблону. Нам придётся этот шаблон ей скармливать. Шаблонные значения CHI можно взять как раз из этого файла: frag.txt 6.4 KB. Если в файле нет какой-то аминокислоты, то можно взять PDB-файл с этой аминокислотой, открыть его в программе Molmol и сохранить в формате ang

Да, кстати. мы говорили о версии программы, которая будет брать тысячи фаст из папки, обрабатывать и сохранять в другую папку картинки со вторичной структурой. Это актуальнее, чем 3D модуль.

24 June 2024 00:06 Александр Кушелев: Последняя версия программы выдаёт сообщение и ничего не делает: 


Может быть кроме экзешника нужно что-то ещё прислать? Может быть набор графических элементов обновился? Или шрифт Italic нужно добавить? 

 

 Продолжение следует...


Приглашение к сотрудничеству

На базе научного открытия нами создан онлайн-сервис по определению структуры белковых молекул. Теперь мы сможем зарабатывать вместе.

По старой технологии определение одной структуры белка обходится примерно в 10 000 евро, а ждать нужно от 2 месяцев до 3 лет. По новой технологии структура определяется в 1000 раз точнее и в миллиард раз быстрее. 80% от найденного Вами заказа принадлежат Вам, как менеджеру.

Наш лозунг: "В 1000 раз лучше, в 1000^3 быстрее и в 1000 раз дешевле!"

Ваша задача заключается в размещении рекламы на онлайн-сервис белковых структур. Рынок этих структур очень большой и продолжает стремительно расти. Ежедневно кто-то оплачивает до 60 структур по средней цене 10 000 евро за штуку. Новая технология позволила на одном персональном компьютере за неделю определить структуры всех 115 000 белков человека, для которых известна нуклеотидная кодирующая последовательность. При этом качество результата, полученного по новой технологии в 1000 раз выше по точности, в миллиард раз по быстродействию и в 30 раз шире по номенклатуре белковых молекул. Единственное, что нам сегодня не хватает - рекламы.

Как получить Вашу первую зарплату менеджера? Найти заказчика белковых структур  и убедить его заказать за счёт лаборатории Наномир пробный заказ. Когда заказчик распробует новую технологию, он начнёт делать коммерческие заказы. С первого коммерческого заказа менеджер получает 80%. С последующих заказов процент будет постепенно уменьшаться, но с первого заказа другого заказчика менеджер снова получит 80%. Зарплата менеджера может достичь миллиона евро в день. И это не предел.


 

 

Инвестирование научных проектов

Приглашаем инвесторов и меценатов.

Как продвинуть цивилизацию на новый уровень своего развития и получить при этом огромные прибыли?

- Вложить деньги
в научные разработки.

Новейшие виды экологически чистых и мощных источников энергии, средство для продления жизни, 
высокие технологии.

Все это реально создать в ближайший год-два при наличии достаточного финансирования.


Готовые коммерческие продукты

 

1. Online service PROTEIN PICOTECHNOLOGY

2. Сверхдобротные одномодовые диэлектрические резонаторы в т.ч. с большим диапазоном перестройки

3. Станки для производства высокодобротных одномодовых резонаторов 

4. Технология изготовления сапфировых линз 

5. Магнитный тороидально-сферический конструктор

Проекты

01 Ruby Emdrive (Микроволновый двигатель без реактивной струи)

02 Ruby Power Source (Микроволновый источник энергии) 

03 Средство продления жизни (Возвращение молодости)

04 Октаэдрический редуктор

05 Шестеренчатая передача Кушелева

06 Магнитный подвес-стыковка-герметизация модулей

07 Ионно-микроволновый фрактальный излучатель

08 Гибкий отражатель из жестких элементов

09 Энциклопедия "Наномир"

10 Экспертиза

11 Конструктивные компьютерные игры

12 Интеллектуальный кодовый замок

13 Очки кругового обзора

14 Тетраэдрический сканер

15 Программируемая архитектура

16 Источник энергии промышленной частоты

17 Источник энергии постоянного тока

18 Монокристаллическая видеокамера

19 Система определения активных участков белка

20 Тераваттный лазер непрерывного действия

21 Бактериальный синтез алмазов

22 Шестеренчатые передачи с тремя степенями свободы

23 Сверхсветовая связь

24 Безосевая шестеренчатая передача

25 Aктивный язык программирования

26 Телевидение миллиметрового и оптического диапазонов

27 Микроволновая архитектура

28 Компьютерный экран из автономных элементов

29 Чтение / запись ДНК

30 Сверхсветовая локация / зрение

31 Нейтрализатор акустического сигнала

Коммерческое предложение: 

Виктория Соколик: Уважаемые коллеги, Вашему вниманию предоставляется услуга -- моделирование 2D и 3D структуры любого белка без ограничений в его размере и степени изученности с помощью программного обеспечения, базирующемся на принципиально новом подходе декодирования нуклеотидной последовательности, детерминирующей данный белок.

Всё, что необходимо от заказчика, это нуклеотидная последовательность мРНК интересующего его белка (или код этой нуклеотидной последовательности в EMBL, или хотя бы код самого белка в PDB).

В течение 1-3 суток мы готовы предоставить Вам схему вторичной структуры заказанного белка (2D), модель его пространственной структуры (3D) в виртуальном пространстве, а также файл .pdb с координатами каждого атома белка. 

Файл .pdb может быть использован по аналогии с файлами закристаллизованных белков из PDB банка для дальнейшего конформационного анализа белка методами молекулярной динамики с учётом физико-химической специфики микроокружения белка или его взаимодействия с лигандами.

Таким образом, Вы сможете максимально быстро удобным для Вас способом (по электронной почте, на сайте либо на электронном носителе) получить информацию о структуре Вашего белка.

 Сотрудничество может быть различным:

- участие в научных дискуссиях на форуме (конструктивное)

- совместное создание коммерческого продукта

- поиск инвесторов

- выступить менеджером по продаже готовых коммерческих продуктов 

- конструктивные предложения по продвижению идей лаборатории Наномир

- содействие в проведении экспериментов и т.п.

- написание совместных научных статей и т.п.

- материальный вклад (денежный или обеспечение оборудованием и материалами)

 

Пожалуйста, сообщайте о своем вкладе, чтобы мы зачли Вас как партнера лаборатории Наномир.

Telegram: https://t.me/nanoworldlab

Приглашение в группу: https://t.me/nanoworld_discussion 

WhatsApp: +7 926 850-54-22

mail: kushelev20120@yandex.ru


О способах финансирования можно спросить по электронной почте и на телеграм-канале. 

Огромное спасибо всем за помощь и поддержку! 


В избранное