Использование методов теории распознавания образов для диагностики шизофрении

шизофрения
Использование методов теории распознавания образов для диагностики шизофрении

В настоящее время в практических приложениях, в том числе и в медицинских и экологических, используется достаточно большое количество различных методов распознавания образов, причем известно, что большинство из них «хорошо» работают, если структура классификационных данных удовлетворяет ограничениям, присущим соответствующим математическим моделям. Здесь под структурой данных (классов) понимается конфигурация точек-объектов в пространстве признаков, подчеркивая тем самым, что через нее отображаются основные взаимоотношения между исследуемыми объектами. Чтобы решить вопрос о выборе того или иного известного метода распознавания образов для решения конкретной диагностической задачи (класса задач) требуются хотя бы предварительные сведения о структуре классов решаемой задачи.

Проблема выбора типа решающих правил для решения конкретной задачи распознавания и в частности для решения задач медицинской диагностики не является тривиальной и зависит от совокупности разных факторов: от типа и характера измерительных шкал, геометрической структуры многомерных данных, объема обучающего материала, возможности иметь точные указания учителя для обучающей выборки и т.д.

В медицинской практике большой процент диагностических задач формируется так, что для получения требуемого результата используются эмпирические (эвристические) правила. Такая ситуация характерна в основном для описательных наук (к которым в основном относятся медицинские и экологические науки), в которых для получения результата используются обычно не вычисления, а последовательность рассуждений. Результат при этом представляется в виде некоторого суждения, устанавливающего принадлежность объекта к соответствующему классу. В качестве решающих правил в этой ситуации применяют правила четкого или нечеткого логического вывода, получаемые на основе литературных данных, отражающих обобщенный многолетний медицинский опыт или опросом квалифицированных экспертов. В результате обычно строится иерархическая древовидная структура, «корнем» которой является наименование нозологической формы, а конечными элементами – признаки болезни, значения которых выявляются при обследовании пациента различными способами (опрос, осмотр, лабораторные исследования и т.д.).

В ситуации, когда используется вероятностное задание признаков и классов, решается вопрос о возможности или целесообразности построения наилучших решающих правил на основе детального анализа признакового пространства путем построения функций плотности вероятности и получения надежных оценок априорных вероятностей. Классифицируемый объект считается принадлежащим к тому образу, плотность объектов которого наивысшая в данной точке пространства описания.

Однако на практике плотности распределения вероятностей получить очень сложно, поэтому формируются специальные таблицы экспериментальных данных (ТЭД) ограниченного объема (обучающие выборки) с известной классификацией. По обучающим выборкам могут быть восстановлены или оценены функции плотностей вероятностей, по которым и строятся соответствующие решающие правила.

При обработке ТЭД с целью распознавания образов могут использоваться различные алгоритмы, число которых в современном арсенале достаточно велико. Однако, как показывают многообразные практические исследования, для решения широкого круга медицинских и экологических задач, признаковое пространство которых можно рассматривать как многомерное гиперпространство, достаточно иметь алгоритмы распознавания трех типов: основанные на локальной оценке плотностей без задания явного вида решающих правил (ближнего соседа, средней связи и т.д.); основанные на задании вида разделяющих функций; диалоговые методы классификации. При этом следует иметь ввиду, что большинство из известных алгоритмов распознавания образов «хорошо» работают, если структура классификационных данных удовлетворяет ограничениям присущим соответствующим математическим моделям, например, алгоритм «средней связи» дает лучшие результаты, чем «ближайшего соседа» при простой форме образов (шаровые или эллипсоидные группы объектов). Здесь под структурой данных (классов) понимается геометрическая конфигурация точек-объектов в пространстве признаков.

Анализ задач медицинской диагностики показал, что многие из них имеют сложную геометрическую структуру. Это связано с тем, что человек и окружающая его среда представляет собой чрезвычайно сложный, динамичный объект и, следовательно, его состояния могут быть описаны лишь большим набором взаимозависимых признаков, которые с трудом поддаются формализованному описанию.

В этих условиях для успешного решения задачи принятия диагностических решений необходимо иметь аппарат, обеспечивающий изучение структуры классов с выдвижением соответствующих гипотез на языке специалистов исследуемой предметной области. В анализе данных таким аппаратом является вычислительный эксперимент. Для решения задач классификации и диагностики вычислительный эксперимент реализуется с помощью диалоговых интерактивных систем распознавания образов (ДСР). Понятие диалога в этих системах несколько отличается от традиционного. Здесь режим диалога ориентирован прежде всего на поддержку пользователем принятия решений о структуре многомерных классов с подбором соответствующих методов и алгоритмов обработки данных, наиболее подходящих к искомой структуре данных (этап качественного решения задачи анализа данных). На этапе количественного описания данных производится поиск параметров выбранных пользователем моделей и, методом проб и оценок, делается окончательный выбор конкретной (чаще всего одной) решающей модели.

Одной из самых сложных и плохоформализуемых задач является задача изучения структуры классов, которая решается путем отображения многомерных данных в одно-, двух- или трехмерные пространства, в которых человек имеет возможность увидеть структурные особенности исследуемых классов, сделать определенные предположения, выдвинуть гипотезы, определить дальнейшую стратегию решения задачи распознавания и др.. Естественно при этом, что способы отображения должны мало искажать исходную структуру данных. Обычно при отображениях, как правило, обеспечивается сохранение близости объектов, определенной в исходном пространстве признаков.

Классической процедурой уменьшения размерности путем формирования линейных комбинаций признаков является метод анализа главных компонент, предложенный Пирсоном и разработанный Хотеллингом. Он неявно присутствует в факторном анализе. Этот метод устойчив по отношению к случайным флуктуациям данных. Однако класс отображений ограничивается ортогональным проектированием.

В этом подходе отображение исходной информации в двумерное пространство обеспечивает непосредственное достижение конечной цели -разделение классов состояний. То есть, в такой диалоговой системе распознавания два различных этапа – отображение данных с целью анализа их структуры и решение задачи классификации объединяются в единую процедуру, тогда как в традиционных диалоговых системах отображение используется для получения промежуточной информации о структуре образов и только затем решается собственно задача распознавания, что значительно усложняет ведение диалога и требует дополнительных программно-аппаратных затрат.

Поскольку пользователя в предлагаемом методе большей частью интересует зона наложения классов в отображающем пространстве, а не общая их структура, то количество информации для анализа значительно сокращается. Специалист, ведущий обучение, получает возможность сразу наблюдать решение поставленной задачи и при необходимости корректировать результат обучения с помощью простых правил.

Для реализации процесса обучения разработан специальный алгоритм и пакет прикладных программ, состоящий из формальных и неформальных процедур, обеспечивающих режим диалога человека с ЭВМ.

Формальные процедуры, ориентированные в основном на минимизацию соответствующих функционалов качества и позволяют отыскивать их локальные и, при простых структурах классов, глобальные экстремумы.

Переход к неформальным и частично формализованным процедурам оправдан там, где строгая формализация сопряжена со значительными трудностями и временными затратами, а специфика задач позволяет эффективно использовать пространственные представления и интеллектуальные возможности человека. Человек, ведущий обучение (возможно со специалистами предметной области, в интересах которых решается задача распознавания), зная свойства отображающих функций, решает хорошо известную ему задачу по зрительному анализу плоских областей в Ф и на основании этого анализа, в соответствии с общим алгоритм обучения, выбирает формальную математическую процедуру, уточняющую искомые параметры векторов А и В. При недостатке обучающей информации используется опыт и интуиция специалистов. Анализ картин отображений в Ф позволяет легко выделять артефакты, казуистические ситуации, группировки объектов, зоны наложения, некомпактности в отображениях и т.д.