Отправляет email-рассылки с помощью сервиса Sendsay

Новости лаборатории Наномир

  Все выпуски  

1320 Создаём программу Binary_SS для корреляционного анализа. Часть 14.


Выпуск 1320
2024-05-03

Лаборатория Наномир

Когда реальность открывает тайны,
уходят в тень и  меркнут чудеса ...

Создаём программу Binary_SS для корреляционного анализа.

Часть 14.

 Предыдущую часть см. в выпуске 1316 

26 April 2024 04:13 Программист: Binary_SS.rar 754.8 KB

Здравствуйте, Александр, архив программы последней версии с исходниками

08:39 Александр Кушелев: Благодарю!

28 April 2024 10:24 Александр Кушелев: Здравствуйте, Роман! Я так понял, что Вы сегодня уже планируете устранить проблему. Если у Вас будет возможность продолжить делать новую версию программы, то хотелось бы добавить возможность сохранять не только текстовый файл с чёрно-белой псевдодграфикой, но и файл html с цветной графикой. Включение цветного режима должно регулироваться из ини-файла.

config.ini 4.0 KB

Такой ини-файл у меня сейчас. Можете его использовать в дальнейшем?

11:15 Программист: Окей.

Я, кажется, обнаружил проблемное место. Сейчас попробую объяснить подробнее.

11:20 Александр Кушелев: Кстати, нужно ещё сделать конкатенацию единиц от всех корректных файлов PDB/ent.

А самая актуальная задача - использовать html-файлы из Uniprot с этим блоком вторичной структуры: https://i.ibb.co/7jttKXt/20240424-301.png

Из такого файла: https://www.uniprot.org/uniprotkb/A0A1Q9E695/entry

11:42 Программист: Voice message

11:50 Александр Кушелев: ЗдОрово!

12:16 Программист: Binary_SS.rar 756.5 KB

Версия с исправлениями.

12:17 ... завтра напишу, обсудим дальнейшие задачи, что выше Вы написали, более подробно.

12:18 Александр Кушелев: Отлично! Удачи!

12:20 Программист: Я так понял, для псевдографики кода-1 элемента 0, Вы хотели пустую строку использовать, пытались в конфиге задать 0. Но этот трюк у меня сделан только для псевдографики кода-4. Для того, чтобы была пустая строка у элемента 0 кода-1 можно ничего не писать после знака =.  Я это в конфиге из архива выше учёл.

[code1]

pseudogeaphics0 =

Вот так делаем, и будет пустая строка.

12:22 Александр Кушелев: Отлично!

А почему псевдографика стала пунктирной?

Ха! Пунктиром псевдографику, как оказалось, показывает другой редактор текста (Em_Editor) :)


00011_code4.txt 1.1 KB

Теперь понятно, как по единицам может быть корреляция равна нулю, а по нулям 100%. Программа работает корректно.

00021_code4.txt 6.4 KB

А тут непонятно, почему корреляция по нулям не 100% ?

29 April 2024 07:34 Программист: У меня она в notepad++ тоже пунктирная, а в обычном блокноте слитно выводится.

С ходу так сказать сложно, посмотрю подробнее, как к компьютеру попаду. Но сразу приходит догадка, что дело в подрезании спиралей в кодах-1

В таблице кода-4 фаста точно выводится не подрезанная.

А вот pdb, не помню.. но, кажется, подрезанный

11:54 Александр Кушелев: Да. Сначала должно быть подрезание, а потом уже вычисление корреляции :)

Для корреляции по единицам так и должно быть. А для вычисления корреляции по нулям должно быть другое подрезание. Кстати, его тоже интересно было бы визуализировать. Но для этого нужно сделать ещё один столбец - подрезание кода-1 из фасты для корреляции по нулям. И тогда будет визуализирована не только корреляция по единицам, но и корреляция по нулям.

А у меня в notepad++ слитно выводится.

А можно вывести

1. неподрезанный PDB

2. подрезанный PDB

и для корреляции по нулям

3. неподрезанную фасту

4. подрезанную фасту ?

Тогда уже всё можно будет визуально проконтролировать.

15:31 Программист: Да, так можно сделать. В этой же таблице с кодом-4?

Ещё нужно в голове держать, что код-1 с конца может быть подрезан перед подрезанием спиралей. Так как коды-1 из fasta и pdb не всегда равны по длине

Поэтому перед корреляцией коды-1 приводятся к одинаковой длине. Более длинный код подрезается с конца до длины более короткого. И потом уже корреляции считаются с подрезанием спиралей.

15:43 Александр Кушелев: Да, конечно в этой же таблице. Просто добавить ещё два столбца.

Понятно, что они могут быть подрезанными. Но они должны быть синхронизированы по аминокислотной последовательности.

Это правильно. Тогда интересно ещё выделить тот участок, который остался после подрезания. Например, то, что отрезано, изобразить иксами "XXXXXX"

А рабочий участок уже пробелами и черными прямоугольниками.

17:31 Программист: Да, у нас так и есть. Мы код-1 из fasta обрезаем с начала, если это требуется. Иногда бывает, что идёт совпадение ami прям сразу и обрезать код фасты не нужно

Тогда только коды-1 приводятся к одной длине (путем обрубания более длинного справа) и ищется корреляция.

Окей

Окей, выведем ещё две колонки тогда, по кодам-1. Они будут самые правые в таблице, а порядок какой делаем?

Сейчас у нас есть 2 колонки:

BCF - фаста без подрезанных спиралей;

BCP - pdb с подрезанными спиралями

коды-1 с подрезанными спиралями предлагаю назвать так: BCFC (Binary Code from Fasta Cutted) и BCPC (Binary Code from Pbd Cutted).

Коды-1 до обрезания спиралей пускай называются так как сейчас BCF и BCP

Порядок можно сделать таким:

BCF | BCFC | BCP | BCPC

18:33 Александр Кушелев: Да. Так подходит

А отрезанные позиции, которые не участвуют в подсчёте корреляции, нужно забить иксами.

30 April 2024 23:55 Александр Кушелев: После вывода новых столбцов и ввода вторичной структуры в ещё одном формате, нужно будет заменить черно-белую псевдографику на цветную графику в формате html:


1 May 2024 00:06 Александр Кушелев: В компактном представлении та же структура: 

 

11:32 Программист: Очередной этап программы доделан!

Было реализовано:

- в таблицу с информацией о коде-4 добавлен вывод кода-1 с "подрезанными" спиралями для FASTA и PDB/ENT;

- добавлен индикатор, демонстрирующий количество папок, для которых рассчитана корреляция;

теперь файлы с информацией о коде-4 будут выглядеть следующим образом

code4.txt 17.9 KB

И еще одно приятное дополнение, теперь в программу добавлен индикатор с числом обработанных папок. Так будет проще ориентироваться, когда программа отработает до конца.

Элемент псевдографики для подрезанных спиралей задается через конфиг, по дефолту равен "X"

Начну делать новый этап.

12:47 Александр Кушелев: Отлично! 

2 May 2024 08:19 Программист: Binary_SS.rar 756.4 KB

16:15 Александр Кушелев: Благодарю! 

Следующая по срочности проблема - чтение нового формата вторичной структуры.


Из такого файла: https://www.uniprot.org/uniprotkb/A0A1Q9E695/entry

Я правильно понимаю, что при расчёте корреляции "по нулям" проверяются только те позиции, где нули (после подрезания) из pdb/ent? Судя по пседографике это так. И это правильно.

Можете показать на примере белка из папки 00002, как рассчитывается корреляция "по нулям" и получается величина 79.31% ?

00002_code4.txt 16.3 KB

По алгоритму нужно делить число нулей из pdb/ent, которые попали на нули из fasta на общее число нулей по pdb/ent. У меня не сходится.

3 May 2024 04:37 Программист: Да, так и есть

Сегодня проверим это. Детально разберём.

09:44 Александр Кушелев: Благодарю!


Совпадение нулей я обозначил красным цветом, отсутствие совпадения - синим.

Отношение совпавших к общему числу равно 16/(8+16)=0.6667, т.е. 66.67%

Программа выдаёт: 79.31 Не сходится. 

 

Продолжение следует... 


Приглашение к сотрудничеству

На базе научного открытия нами создан онлайн-сервис по определению структуры белковых молекул. Теперь мы сможем зарабатывать вместе.

По старой технологии определение одной структуры белка обходится примерно в 10 000 евро, а ждать нужно от 2 месяцев до 3 лет. По новой технологии структура определяется в 1000 раз точнее и в миллиард раз быстрее. 80% от найденного Вами заказа принадлежат Вам, как менеджеру.

Наш лозунг: "В 1000 раз лучше, в 1000^3 быстрее и в 1000 раз дешевле!"

Ваша задача заключается в размещении рекламы на онлайн-сервис белковых структур. Рынок этих структур очень большой и продолжает стремительно расти. Ежедневно кто-то оплачивает до 60 структур по средней цене 10 000 евро за штуку. Новая технология позволила на одном персональном компьютере за неделю определить структуры всех 115 000 белков человека, для которых известна нуклеотидная кодирующая последовательность. При этом качество результата, полученного по новой технологии в 1000 раз выше по точности, в миллиард раз по быстродействию и в 30 раз шире по номенклатуре белковых молекул. Единственное, что нам сегодня не хватает - рекламы.

Как получить Вашу первую зарплату менеджера? Найти заказчика белковых структур  и убедить его заказать за счёт лаборатории Наномир пробный заказ. Когда заказчик распробует новую технологию, он начнёт делать коммерческие заказы. С первого коммерческого заказа менеджер получает 80%. С последующих заказов процент будет постепенно уменьшаться, но с первого заказа другого заказчика менеджер снова получит 80%. Зарплата менеджера может достичь миллиона евро в день. И это не предел.


 

 

Инвестирование научных проектов

Приглашаем инвесторов и меценатов.

Как продвинуть цивилизацию на новый уровень своего развития и получить при этом огромные прибыли?

- Вложить деньги
в научные разработки.

Новейшие виды экологически чистых и мощных источников энергии, средство для продления жизни, 
высокие технологии.

Все это реально создать в ближайший год-два при наличии достаточного финансирования.


Готовые коммерческие продукты

 

1. Online service PROTEIN PICOTECHNOLOGY

2. Сверхдобротные одномодовые диэлектрические резонаторы в т.ч. с большим диапазоном перестройки

3. Станки для производства высокодобротных одномодовых резонаторов 

4. Технология изготовления сапфировых линз 

5. Магнитный тороидально-сферический конструктор

Проекты

01 Ruby Emdrive (Микроволновый двигатель без реактивной струи)

02 Ruby Power Source (Микроволновый источник энергии) 

03 Средство продления жизни (Возвращение молодости)

04 Октаэдрический редуктор

05 Шестеренчатая передача Кушелева

06 Магнитный подвес-стыковка-герметизация модулей

07 Ионно-микроволновый фрактальный излучатель

08 Гибкий отражатель из жестких элементов

09 Энциклопедия "Наномир"

10 Экспертиза

11 Конструктивные компьютерные игры

12 Интеллектуальный кодовый замок

13 Очки кругового обзора

14 Тетраэдрический сканер

15 Программируемая архитектура

16 Источник энергии промышленной частоты

17 Источник энергии постоянного тока

18 Монокристаллическая видеокамера

19 Система определения активных участков белка

20 Тераваттный лазер непрерывного действия

21 Бактериальный синтез алмазов

22 Шестеренчатые передачи с тремя степенями свободы

23 Сверхсветовая связь

24 Безосевая шестеренчатая передача

25 Aктивный язык программирования

26 Телевидение миллиметрового и оптического диапазонов

27 Микроволновая архитектура

28 Компьютерный экран из автономных элементов

29 Чтение / запись ДНК

30 Сверхсветовая локация / зрение

31 Нейтрализатор акустического сигнала

Коммерческое предложение: 

Виктория Соколик: Уважаемые коллеги, Вашему вниманию предоставляется услуга -- моделирование 2D и 3D структуры любого белка без ограничений в его размере и степени изученности с помощью программного обеспечения, базирующемся на принципиально новом подходе декодирования нуклеотидной последовательности, детерминирующей данный белок.

Всё, что необходимо от заказчика, это нуклеотидная последовательность мРНК интересующего его белка (или код этой нуклеотидной последовательности в EMBL, или хотя бы код самого белка в PDB).

В течение 1-3 суток мы готовы предоставить Вам схему вторичной структуры заказанного белка (2D), модель его пространственной структуры (3D) в виртуальном пространстве, а также файл .pdb с координатами каждого атома белка. 

Файл .pdb может быть использован по аналогии с файлами закристаллизованных белков из PDB банка для дальнейшего конформационного анализа белка методами молекулярной динамики с учётом физико-химической специфики микроокружения белка или его взаимодействия с лигандами.

Таким образом, Вы сможете максимально быстро удобным для Вас способом (по электронной почте, на сайте либо на электронном носителе) получить информацию о структуре Вашего белка.

 Сотрудничество может быть различным:

- участие в научных дискуссиях на форуме (конструктивное)

- совместное создание коммерческого продукта

- поиск инвесторов

- выступить менеджером по продаже готовых коммерческих продуктов 

- конструктивные предложения по продвижению идей лаборатории Наномир

- содействие в проведении экспериментов и т.п.

- написание совместных научных статей и т.п.

- материальный вклад (денежный или обеспечение оборудованием и материалами)

 

Пожалуйста, сообщайте о своем вкладе, чтобы мы зачли Вас как партнера лаборатории Наномир.

Telegram: https://t.me/nanoworldlab

Приглашение в группу: https://t.me/nanoworld_discussion 

WhatsApp: +7 926 850-54-22

mail: kushelev20120@yandex.ru


О способах финансирования можно спросить по электронной почте и на телеграм-канале. 

Огромное спасибо всем за помощь и поддержку! 


В избранное