Международная группа ученых-биоинформатиков разработала программу Dereplicator, позволяющую упростить и ускорить поиск продуктов жизнедеятельности бактерий, которые являются потенциальными антибиотиками, противоопухолевыми или противовирусными препаратами. Активное участие в создании и усовершенствовании программного продукта приняли младшие научные сотрудники СПбГУ Алексей Гуревич и Алла Михеенко. Разработка инструмента проводилась в том числе на базе лаборатории «Центр алгоритмической биотехнологии» СПбГУ под руководством Павла Певзнера.

Программа Dereplicator позволяет ученым сравнивать имеющиеся базы химических структур продуктов жизнедеятельности микроорганизмов (так называемых Natural Products) с входными данными в виде масс-спектров* тех веществ, которые интересуют исследователя в данный момент. Инструмент определяет, какие химические соединения из новых входных данных уже содержатся в базе известных Natural Products. Таким образом, отбросив найденные реплики соединений, которые были изучены ранее и зарегистрированы в базе, он помогает в разы уменьшить объем поиска и сфокусироваться на тех веществах, которые потенциально могут стать новыми антибиотиками.

Dereplicator создан специально для работы с Natural Products — соединениями, которые производят бактерии и более сложные организмы в процессе борьбы за собственное выживание. Именно эти вещества могут являться природными антибиотиками. Поэтому сегодня, когда разработка новых антибактериальных препаратов является одной из приоритетных задач современной науки, их исследованию ученые придают особое значение. Сложность работы с Natural Products состоит в том, что эти вещества помимо 20 стандартных аминокислот, формирующих обычные белки, содержат множество нестандартных. Эти аминокислоты в свою очередь формируют сложные химические структуры. Уникальность нового программного продукта заключается в том, что в отличие от своих аналогов, предназначенных для работы с обычными белками, то есть с линейной последовательностью стандартных аминокислот, он позволяет обрабатывать и более сложные структуры — циклические и разветвленные.

Ученым СПбГУ удалось усовершенствовать программу и сделать ее доступной для широкого круга пользователей. Именно с этой целью была разработана веб-версия продукта, которой сегодня могут пользоваться ученые всего мира, зарегистрированные на платформе GNPS (The Global Natural Product Social Molecular Networking). Запуск стабильной версии программы на сайте GNPS состоялся в декабре 2015 года. Это позволило целевой аудитории разработки — химикам и биологам — запускать программу прямо с сайта с использованием удобного графического интерфейса. Ранее круг пользователей продукта был довольно узким, так как изначально программа разрабатывалась только как консольное приложение для операционных систем Linux и Mac OS X.

Кроме того, биоинформатики Санкт-Петербургского университета значительно увеличили скорость работы инструмента. Если в сентябре 2015 года запуск первой версии программы на всем объеме общедоступных данных GNPS занимал неделю, то сегодня Dereplicator способен обработать эти же данные за 4 часа. Также петербургским ученым удалось визуализировать результаты работы программы (отрисовать химическую структуру найденных веществ и их соответствия пикам масс-спектров), исправить ряд ошибок, которые влияли на точность результатов, и добавить подсчет процента ложноположительных срабатываний (False Discovery Rate).

«Мы смогли сделать Dereplicator доступным и удобным в использовании, — рассказывает младший научный сотрудник СПбГУ Алексей Гуревич. — Теперь эту программу легко запустить, она быстро работает и выдает наглядные результаты. Безусловно, мы будем продолжать усовершенствование продукта, чтобы с его помощью ученые смогли выявлять новые антибиотики, противоопухолевые и противовирусные вещества в более короткие сроки».

Подробнее о разработке читайте в статье Dereplication of peptidic natural products through database search of mass spectra, 31 октября 2016 года. См. также материал на портале СПбГУ