#covid19 Учёные вычислили геном более 130 тысяч новых вирусо | Вирусология
#covid19
Учёные вычислили геном более 130 тысяч новых вирусов
Международное сотрудничество ученых СПбГУ (Центр биоинформатики и алгоритмической биотехнологии), Института Пастера (Франция), Университета Британской Колумбии (Канада), Калифорнийского университета в Беркли (США), Гейдельбергского института теоретических исследований (Германия) и других исследователей по всему миру позволило обнаружить в недрах существующих открытых геномных данных более 130 000 новых, ранее неизвестных вирусов.
По мнению ученых, в природе существуют триллионы до сих пор неизвестных вирусов, многие из которых могут быть смертельными и потенциально способными спровоцировать следующие пандемии. Однако далеко не все они столь опасны.
Опубликованная в журнале Nature работа может служить основой так называемой петабайтной геномики, оперирующей ранее непостижимым количеством данных ДНК и РНК (в опубликованном исследовании проанализировано 16 петабайт геномных последовательностей). Единица измерения количества информации петабайт равна 1015 (квадриллиону) байт.
«Чтобы справиться с такими объемами информации, была создана платформа Serratus, содержащая целый набор компьютерных инструментов, специально предназначенных для эффективной работы с данными в облаке, — отметил участник международного проекта, ведущий сотрудник Центра биоинформатики и алгоритмической биотехнологии СПбГУ Антон Коробейников. — Однако без созданного в Центре совместно с моим коллегой Дмитрием Мелешко сборщика РНК-вирусов coronaSPAdes качественно «пересобрать» геномные вирусные данные было бы гораздо сложнее».
«Главная задача коллаборации Serratus заключалась в том, чтобы создать мощное, очень точное и чувствительное «сито» для обработки огромных количеств данных, отобрать данные, относящиеся к РНК-вирусам, сузив масштабы от петабайтов до гигабайтов, доступных для относительно быстрой обработки с применением обычных вычислительных мощностей.
-Созданный же сборщик coronaSPAdes — наш кирпичик в уникальной конструкции Serratus, каждый из участников которой занимался своим делом, которое хорошо знает, поэтому у нас все и получилось», — считает сотрудник Центра алгоритмической биотехнологии СПбГУ Дмитрий Мелешко.