Ученые используют машинное обучение для идентификации источника сальмонеллы

Быстрая идентификация инфекций из животного источника – ключ к прекращению вспышек болезней пищевого происхождения.

Ученые из Центра безопасности пищевых продуктов Университета Джорджии (University of Georgia Center for Food Safety in Griffin) в Гриффине разработали метод машинного обучения, который поможет более быстро идентифицировать источник определенных вспышек сальмонеллеза у животных.

Материалы и методы обследования

В исследовании, опубликованном в научном журнале Emerging Infectious Diseases, Сянъю Дэнг (Xiangyu Deng) с соавторами использовали более тысячи геномов для определения источников S. Typhimurium у животных, особенно у домашнего скота. Исследователи создали машинный алгоритм под названием Random Forest, основываясь на более чем 1300 ген S. Typhimurium с известными источниками. С помощью машинного алгоритма ученые определили животные источники генома S. Typhimurium. Для этого исследования ученые использовали геномы Salmonella Typhimurium из 3 основных программ наблюдения и мониторинга.

Результаты научной работы

По данным Системы эпиднадзора за вспышками болезней пищевого происхождения, в США с 2009 по 2015 год было зарегистрировано около 3000 вспышек болезней пищевого происхождения. Из них 900 – или 30%- были вызваны различными серотипами сальмонеллы, S. Typhimurium.

«У нас было как минимум 3 вспышки S. Typhimurium или его близкого серотипа в 2018 году. Эти вспышки были связаны с курицей, куриным салатом и сушеным кокосом», – сказал Сянъю Дэнг. «Существует более 2600 серотипов сальмонеллы, и S. Typhimurium является лишь одним из них, но с 1960-х годов около четверти изолятов сальмонеллы, связанных со вспышками, о которых сообщалось в национальном надзоре США, составляют S. Typhimurium».

«При таком количестве геномов машинное обучение является естественным выбором для обработки всех этих данных. Мы использовали эту большую коллекцию геномов S. Typhimurium в качестве учебного набора для создания классификатора», – сказал Дэн. 

«Алгоритм определяет источник изолята S. Typhimurium путем обследования тысяч людей, генетических особенностей их генома».

В целом, алгоритм определил животный источник S. Typhimurium с 83% точностью. Алгоритм лучше всего работает при прогнозировании источников, таких как птицы и свиньи, за ним следуют источники крупного рогатого скота и диких птиц. Алгоритм также обнаруживает, точен ли прогноз или неточен. Точность алгоритма превышала 92%.

«Мы ретроспективно проанализировали 8 крупных зоонозных вспышек, которые произошли в США с 1998 по 2013 год», – сказал Дэн. Выявление причины вспышки болезней пищевого происхождения является ключом к ее прекращению и предотвращению новых заболеваний.

Авторы другого исследования утверждают, что побочные эффекты бактерий кишечника защищают от сальмонеллы.