Искусственный интеллект по кашлю определит COVID-19

Исследователи Массачусетского технологического института (MIT) пришли к выводу, что люди, у которых нет явных симптомов COVID-19, могут отличаться от здоровых тем, как они кашляют. Эти различия не поддаются расшифровке человеческим ухом. Но оказывается, что их может уловить искусственный интеллект.

В статье, опубликованной в журнале IEEE Journal of Engineering in Medicine and Biology, исследователи сообщает о модели искусственного интеллекта (ИИ), который отличает бессимптомных от здоровых людей с помощью записей кашля, которые добровольно предоставляют через веб-браузер и устройства, такие как мобильные телефоны и ноутбуки.

Актуальность вопроса

Бессимптомные, инфицированные COVID-19 люди по определению не проявляют никаких заметных физических симптомов заболевания. Таким образом, они не проходят тесты на вирус и могут неосознанно распространять инфекцию.

До начала пандемии исследовательские группы уже изучали алгоритмы на записях кашля с мобильных телефонов, чтобы точно диагностировать такие состояния, как пневмония и астма. Аналогичным образом команда Массачусетского технологического института разработала модели искусственного интеллекта для анализа записей кашля, чтобы обнаружить признаки болезни Альцгеймера — болезни, связанной не только со снижением памяти, но и с нейромышечной деградацией, такой как ослабление голосовых связок.

Материалы и методы исследования

Исследователи внесли в модель десятки тысяч образцов кашля, а также произносимых слов. Теперь модель искусственного интеллекта точно идентифицирует 98,5% кашля у людей, у которых был подтвержден COVID-19, включая 100% кашля у бессимптомных — которые сообщили, что у них не было симптомов, но тест дал положительный результат на вирус.

Команда работает над включением этой модели в удобное для пользователя приложение, которое может стать бесплатным, удобным и неинвазивным инструментом прескрининга для выявления людей, которые больны COVID-19. Пользователь может ежедневно входить в систему, кашлять в свой телефон и получать информацию о том, может ли он быть инфицирован, и поэтому должен подтвердить это формальным тестом.

«Эффективное внедрение данного диагностического инструмента может уменьшить распространение пандемии, если каждый будет использовать его перед посещением школы, работы или ресторана», — считает Брайан Субирана (Brian Subirana), научный сотрудник лаборатории автоматической идентификации Массачусетского технологического института.

Сначала исследователи ввели общий алгоритм машинного обучения, или нейронную сеть, известную как ResNet50, чтобы распознавать звуки, связанные с различной степенью силы голосовых связок. Исследования показали, что качество звука «мммм» может быть показателем того, насколько слабы или сильны голосовые связки. 

Команда обучила вторую нейронную сеть распознавать эмоциональные состояния, проявляющиеся в речи, поскольку пациенты с болезнью Альцгеймера и с неврологическим спадом чаще демонстрируют такие чувства как разочарование, чем выражают счастье и спокойствие. Исследователи разработали модель классификатора сентиментальной речи, обучив ее на большом наборе актеров, интонирующих эмоциональные состояния, такие как нейтральное, спокойное, счастливое и грустное.

Затем исследователи обучили третью нейронную сеть на базе данных кашля, чтобы различить изменения в работе легких и дыхательных путей. Наконец, команда объединила все три модели и наложила алгоритм для обнаружения мышечной деградации.

С помощью новой системы искусственного интеллекта команда ввела аудиозаписи, в том числе пациентов с болезнью Альцгеймера, и обнаружила, что может идентифицировать образцы болезни Альцгеймера лучше, чем существующие модели. Результаты показали, что в совокупности сила голосовых связок, настроение, дыхательная активность, а также мышечная деградация являются эффективными биомаркерами для диагностики заболевания.

Когда пандемия коронавируса начала разворачиваться, Субирана задался вопросом, может ли их система искусственного интеллекта для лечения болезни Альцгеймера также работать для диагностики COVID-19, поскольку инфицированные пациенты отмечают некоторые сходные неврологические симптомы, такие как временное нервно-мышечное расстройство.

«На звуки разговора и кашля влияют голосовые связки и окружающие органы. Это означает, что когда вы говорите, часть вашего разговора похожа на кашель, и наоборот. Это также означает, что звуки, которые мы легко извлекаем из беглой речи, ИИ может воспринимать просто из кашля, включая такие вещи, как пол человека, родной язык или даже эмоциональное состояние. На самом деле в том, как вы кашляете, заложено чувство», — говорит Субирана. «Поэтому мы подумали, почему бы нам не попробовать эти биомаркеры болезни Альцгеймера, чтобы увидеть, имеют ли они отношение к COVID».

В апреле команда решила собрать как можно больше записей кашля, в том числе от пациентов с COVID-19. Ученые создали веб-сайт, где люди могут записывать серию кашлей через мобильный телефон или другое устройство. Участники также заполняют анкету о симптомах, которые отмечают, независимо от того, есть ли у них COVID-19, и были ли диагностированы с помощью официального теста, оценки врачом своих симптомов или если они поставили себе диагноз самостоятельно. Пользователи также могут отметить свой пол, географическое положение и родной язык.

Результаты научной работы

На сегодняшний день исследователи собрали более 70 000 записей, каждая из которых содержит несколько эпизодов кашля, что составляет около 200 000 звуковых образцов кашля, которые, по словам Субираны, являются самым большим исследовательским набором данных о кашле, который мы знаем. Около 2500 записей были представлены людьми, у которых было подтверждено наличие COVID-19, включая тех, кто был бессимптомным.

Команда использовала 2500 записей, связанных с COVID-19, а также еще 2500 записей, которые случайным образом выбрали из коллекции, чтобы сбалансировать набор данных. Авторы исследования использовали 4000 таких образцов для обучения модели ИИ. Оставшиеся 1000 записей затем были введены в модель, чтобы увидеть, может ли она точно различать кашель у пациентов с COVID по сравнению со здоровыми. 

Удивительно, но их усилия выявили «поразительное сходство между болезнью Альцгеймера и COVID».

Ученые обнаружили, что искусственный интеллект способен улавливать паттерны в четырех биомаркерах — силе голосовых связок, настроении, легочной и дыхательной деятельности и мышечной деградации — которые специфичны для COVID-19. Модель выявила 98,5% кашля у людей, у которых был подтвержден COVID-19, и из них она точно определила все бессимптомные эпизоды кашля.

«Мы думаем, что способ, которым вы производите звук, меняется, когда у вас есть COVID, даже если нет симптомов», — говорит Субирана.

Модель ИИ не предназначена для диагностики симптоматических пациентов, поскольку их симптомы вызваны COVID-19 или другими состояниями, такими как грипп или астма. Сила этого инструмента заключается в способности отличать бессимптомный кашель от здорового кашля.

Авторы другого исследования заявили, что дыхательный тест предоставляет мгновенные результаты анализа на COVID-19.