Когда ультразвук звучит сбивчиво, но технологии слышат чётко
Сердечно-сосудистые заболевания — не просто частая причина госпитализаций в Гонконге. Это почти постоянный гость в отчётах Минздрава. Люди идут на обследования, врачи смотрят ЭхоКГ, но часто всё заканчивается недосказанным: шум мешает, контуры неясны, снимки непонятны даже для опытного специалиста.
А теперь представьте, что в этом хаосе шумов, пятен и размытых границ появляется — нет, не герой, но весьма умный алгоритм. Его зовут MemSAM.
Кто стоит за разработкой?
Над проектом работала команда под руководством Гарри Циня (Harry Qin), научного сотрудника Школы сестринского дела Политехнического университета Гонконга (School of Nursing, The Hong Kong Polytechnic University). Задача? Научить ИИ разбираться в видеопотоке эхокардиографии, где большинство моделей пасует.
За основу они взяли знаменитую разработку от Meta AI — Segment Anything Model, или SAM, — и переделали её, чтобы та справлялась с медицинскими видео, а не просто отделяла кошку от фона в фото.
Что такого особенного в MemSAM?
Во-первых — память.
Во-вторых — внимание ко времени.
MemSAM — это не просто очередной алгоритм для сегментации изображений. Это модель, которая «помнит» предыдущие кадры, улавливает, как меняются объекты во времени, и находит сердце даже в условиях сильных помех. Вот прям как врач, который посмотрел не один ролик, а знает, как выглядит сердце в динамике.
Этот эффект достигается благодаря технологии space-time memory prompting — пространственно-временные подсказки, которые позволяют системе не теряться, когда сердце сокращается, и его формы с кадра на кадр скачут, как попрыгунчик.
Проблема, которую нельзя было игнорировать
Звуковые артефакты, пятна, размытые границы — эхокардиография давно страдает от «шумного» визуального контента. Разметка таких видео — мучение: врачи часто отмечают только ключевые кадры (например, систолу и диастолу), и из-за этого большинство алгоритмов работают слабо.
А MemSAM… ну, он как будто родился в этих условиях. Он требует минимум аннотаций — и всё равно показывает себя не хуже, а часто и лучше полностью обученных моделей. Сравнение на открытых базах CAMUSи EchoNet-Dynamic это подтверждает: модель уверенно держится в лидерах по точности и стабильности.
Архитектура, похожая на мозаичный мозг
MemSAM — это не просто обёртка вокруг SAM. В его основе — медицинский фреймворк SAMUS, который «заточен» под диагностику. Он обрабатывает видео покадрово, но вместо того, чтобы запрашивать внешний ввод каждый раз, полагается на собственные «воспоминания» — ранее предсказанные маски.
Звучит сложно? Возможно. Но идея проста: не перегружать систему лишним, делать её автономной и устойчивой к помехам. Особенно к тем, что создают ультразвуковые волны, отскакивая от тканей под разными углами.
Почему это может всё поменять
Ручная разметка кардиовизуальных данных — дело кропотливое, а специалистов, умеющих это делать качественно, — немного. Добавьте к этому дороговизну продвинутой диагностики и длинные очереди — вот вам причина, почему даже в развитых странах полноценная проверка сердца не входит в стандартные медосмотры.
MemSAM может это изменить. Модель экономит время, снижает нагрузку на врачей, и при этом работает не хуже традиционных подходов. А если добавить, что она требует меньше данных для обучения — становится ясно: перед нами реальный шаг в сторону демократизации кардиологической диагностики.
Что дальше?
Разработчики не собираются останавливаться. В планах — сделать модель ещё более устойчивой к «плохим» кадрам (а таких хватает — особенно в практике), и попробовать применить MemSAM в других областях медицины. Например, в онкологии или при анализе эндоскопических видео.
И да, остаётся технический вопрос — как ускорить работу модели и снизить требования к «железу». Но это уже не философия, а инженерия. Главное — направление задано.
В двух словах
MemSAM — это не просто умный алгоритм. Это новый стандарт в том, как можно работать с видео сердца. Без шума. Без перегрузки. С перспективой.

Ведущий специалист отдела организации клинических исследований, терапевт, врач ультразвуковой диагностики ООО «ВеронаМед» (г. Санкт-Петербург), главный редактор, учредитель сетевого издания Medical Insider, а также автор статей.
E-mail для связи – xuslan@yandex.ru;