Ученые из университета Глазго разработали геномную модель, способную «ретроспективно или перспективно предсказать вероятность заражения вирусами человека». Результатами исследования они поделились в журнале PLoS Biology
Ученые разработали модели машинного обучения для выделения зоонозных вирусов-кандидатов, используя сигнатуры диапазона хозяев, закодированные в вирусных геномах.
На основе датасета из 861 вирусного вида с присвоенным зоонозным статусом, исследователи собрали единую репрезентативную последовательность генома из сотен видов РНК и ДНК вирусов, охватывающих 36 вирусных семейств.
Они классифицировали каждый вирус как способный инфицировать человека или нет, путем слияния трех ранее опубликованных наборов данных.
Бинарные прогнозы правильно определили почти 72% вирусов, несущих опасность и опасных исключительно для людей, и почти 70% зоонозных вирусов как заражающие человека. После преобразования прогнозируемых результатов зоонозного потенциала на четыре категории, 92% поражающим людей вирусов присвоили средний, высокий или крайне высокий зоонозный потенциал.
Затем ученые протестировали несколько моделей машинного обучения, чтобы выявить найти наиболее эффективную из них. Ее использовали для классификации 758 видов вирусов и 38 вирусных семейств, не представленных в датасете.
Среди второго набора из 645 вирусов животного происхождения модели выявили повышенный риск зоонозной передачи генетически похожих вирусов, не диагностируемых у приматов.
В целом, 70,8% вирусов, отобранных у людей, были правильно идентифицированы как имеющие высокий или крайне высокий зоонозный потенциал.
По их словам, путем выявления вирусов высокого риска и проведения дальнейших исследований прогнозы могут помочь в растущем дисбалансе между быстрыми темпами открытия вирусов и исследованиями, необходимыми для всесторонней оценки риска.
«Чем больше вирусов будет охарактеризовано, тем эффективнее станут наши модели машинного обучения для выявления редких вирусов. Это поможет при разработке превентивной вакцины», – сообщили ученые.