Распознавание образов
Распознавание образов, научное направление, связанное с разработкой принципов и построением систем, предназначенных для определения принадлежности данного объекта к одному из заранее выделенных классов объектов. Под объектами в Р. о. понимают различные предметы, явления, процессы, ситуации, сигналы. Каждый объект описывается совокупностью основных характеристик (признаков, свойств) Х =(x1, ..., xi , ..., xn), где i-я координата вектора Х определяет значения i-й характеристики, и дополнительной характеристикой S, которая указывает на принадлежность объекта к некоторому классу (образу). Набор заранее расклассифицированных объектов, т. е. таких, у которых известны характеристики Х и S, используется для обнаружения закономерных связей между значениями этих характеристик и поэтому называются обучающей выборкой. Те объекты, у которых характеристика S неизвестна, образуют контрольную выборку. Отдельные объекты обучающей и контрольной выборок называются реализациями.
Одна из основных задач Р. о. - выбор правила (решающей функции) D, в соответствии с которым по значению контрольной реализации Х устанавливается её принадлежность к одному из образов, т. е. указываются "наиболее правдоподобные" значения характеристики S для данного Х. Выбор решающей функции D требуется произвести так, чтобы стоимость самого распознающего устройства, его эксплуатации и потерь, связанных с ошибками распознавания, была минимальной. Примером задачи Р. о. этого типа может служить задача различения нефтеносных и водоносных пластов по косвенным геофизическим данным. По этим характеристикам сравнительно легко обнаружить пласты, насыщенные жидкостью. Значительно сложнее определить, наполнены они нефтью или водой. Требуется найти правило использования информации, содержащейся в геофизических характеристиках, для отнесения каждого насыщенного жидкостью пласта к одному из двух классов - водоносному или нефтеносному. При решении этой задачи в обучающую выборку включают геофизические данные вскрытых пластов.
Успех в решении задачи Р. о. зависит в значительной мере от того, насколько удачно выбраны признаки Х. Исходный набор характеристик часто бывает очень большим. В то же время приемлемое правило должно быть основано на использовании небольшого числа признаков, наиболее важных для отличения одного образа от другого. Так, в задачах медицинской диагностики важно определить, какие симптомы и их сочетания (синдромы) следует использовать при постановке диагноза данного заболевания. Поэтому проблема выбора информативных признаков - важная составная часть проблемы Р. о.
Проблема Р. о. тесно связана с задачей предварительной классификации, или таксономией.
В основной задаче Р. o. о построении решающих функций D используются закономерные связи между характеристиками Х и S, обнаруживаемые на обучающей выборке, и некоторые дополнительные априорные предположения, например следующие гипотезы: характеристики Х для реализаций образов представляют собой случайные выборки из генеральных совокупностей с нормальным распределением (см. ниже - Р. о. в математической статистике); реализации одного образа расположены "компактно" (в некотором смысле); признаки в наборе Х независимы и т.д.
В области Р. о. существенно используются идеи и результаты многих др. научных направлений - математики, кибернетики, психологии и т.д.
В 60-х гг. 20 в. в связи с развитием, электронной техники, в частности ЭВМ, широкое применение получили автоматические системы распознавания. Под системами распознавания обычно понимают комплексы средств, предназначенных для решения описанных выше, задач. Методы Р. о. используются в процессе машинной диагностики различных заболеваний, для прогнозирования полезных ископаемых в геологии, для анализа экономических и социальных процессов, в психологии, криминалистике, лингвистике, океанологии, химии, ядерной и космической физике, в автоматизированных системах управления и т.д. Их применение оправдано практически всюду, где приходится иметь дело с классификацией экспериментальных данных. См. также Кибернетика, Кибернетика техническая, Обучающаяся автоматическая система.? Лит.: Себестиан Г.-С., Процессы принятия решений при распознавании образов, пер. с англ., К., 1965; Бонгард М. М., Проблема узнавания, М., 1967; Цыпкин Я. З., Адаптация и обучение в автоматических системах, М., 1968; Айзерман М. А., Браверман Э. М., Розоноэр Л. И., Метод потенциальных функций в теории обучения машин, М., 1970; Загоруйко П. Г., Методы распознавания и их применение, М., 1972; Вапник В. Н., Червоненкис А. Я., Теория распознавания образов, М., 1974.
? А. А. Боровков, Н. Г. Загоруйко.Р. о. в математической статистике - класс задач, связанных с определением принадлежности данного наблюдения к одной из генеральных совокупностей (с неизвестными распределениями), которые представлены лишь конечными выборками. В качестве данного наблюдения может выступать и совокупность наблюдений (выборка) из одной из представленных генеральных совокупностей. Каждое наблюдение представляет собой число или вектор. Часто указанный класс задач называют также дискриминантным анализом или классификацией.
Предположим, что известны n1 наблюдений из генеральной совокупности A1, n2 наблюдений из генеральной совокупности А2 и т.д., nm наблюдений из генеральной совокупности Am, m ³ 2. Дана также выборка z = (z1, ..., zn). Задача Р. о. состоит в определении, какой из генеральных совокупностей Aj, j = 1, 2,..., m, принадлежит выборка z. При этом обычно принимается предположение о том, что распределения P (Ї) совокупностей Ajпринадлежат некоторому семейству {P (Q, ’)} распределений, зависящих от векторного параметра Q, так что Pj (’) = Р (Qj,Ї), где Qj неизвестны.
Если заданы потери Lij, которые несёт наблюдатель, относя выборку 2 к совокупности (образу) Aj, когда она на самом деле принадлежит Ai, то сформулированная задача может рассматриваться и решаться с помощью методов теории статистических игр [стратегией природы здесь является набор (Q1, ..., Qm, j), где j указывает номер совокупности, к которой относится z]. В этом случае возможно отыскание оптимальных "решающих функций", минимизирующих в том или ином смысле потери наблюдателя.
Задачи Р. о. оказываются весьма трудными и исследованы (1975) лишь в отдельных частных случаях. Для общей проблемы при наличии некоторых дополнительных предположений можно указать асимптотически оптимальные правила, дающие потери, приближающиеся к минимальным, когда числа nj, неограниченно возрастают.
Сформулированные задачи представляют собой одну из наиболее естественных математических моделей (формализаций) для задач Р. о.
? А. А. Боровков.Биологический аспект Р. о. тесно связан с организацией поведения животных, которые в природных условиях, как правило, воспринимают внешние объекты одновременно разными органами чувств; поэтому образы реальных предметов объединяют в себе зрительные, тактильные, вкусовые и др. характеристики. Для удобства исследования обычно разделяют процессы, связанные с восприятием и распознаванием оптических, акустических и иных свойств предметов. Термин "образ" чаще применяют в связи со зрительным и слуховым восприятием. Наиболее детально изучено распознавание зрительных образов.
Зрительно воспринимаемый животными и человеком окружающий мир - это трёхмерное пространство с объёмными объектами относительно постоянной формы и окраски, как правило несамосветящимися и заключёнными в прозрачную среду (воздух, воду). Вследствие подвижности как самих животных, так и некоторых внешних объектов, каждому, даже неизменному предмету, соответствует множество различных его изображений на сетчатке глаза, являющихся плоскими проекциями предметов на поверхность её светочувствительных рецепторов. Важнейшая функция системы зрения - реконструкция трёхмерного мира на основе этих плоских изображений, что необходимо для организации активного поведения животных. Внешним проявлением работы механизмов, осуществляющих такую реконструкцию, служит константность восприятия человеком и животным размера, формы и цвета предметов. Не менее важная функция зрительной системы - классификация объектов в соответствии с их биологической значимостью для животного (то, что обычно понимается под узнаванием). В зависимости от вида животного и уровня организации его зрительной системы узнавание происходит различно: животные отличаются как по способности воспринимать определённые оптические свойства объектов (видимая область спектра, цвет, поляризованность света), так и по степени сложности обработки зрительной информации. У низших животных уже в сетчатке имеются специализированные, т. н. детекторные нервные клетки, выделяющие биологически важные признаки объектов непосредственно из сетчатого изображения (например, "детектор тёмного пятна" у лягушки). У высших животных большое значение имеют зрительные центры головного мозга, где тоже найдены специализированные нервные клетки с весьма сложными свойствами. Помимо врождённых механизмов Р. о., в работе зрительной системы, как и др. рецепторных систем, большое значение имеет индивидуальный опыт (научение) и одна из его своеобразных форм - запечатление.
Несмотря на огромное разнообразие животных и различия в аппаратах зрения, имеется много общего в способах обработки зрительной информации животными разных видов. Об этом свидетельствует, в частности, общность средств зрительной маскировки, привлечения и отпугивания, широко используемых в мире животных. Ряд особенностей восприятия и Р. о., лучше изученных для зрительного процесса, имеет общее значение. Так, решаемая слуховой системой задача стабильного восприятия (правильность узнавания) слуховых образов в переменных условиях аналогична задаче константного узнавания окраски. См. также статьи Восприятие, Зрение и лит. при них.
Лит.: Глезер В. Д., Невская А. А., Опознавание зрительных образов, в сборнике: Физиология сенсорных систем, ч. 1 - физиология зрения, Л., 1971 (Руководство по физиологии); International joint conference on pattern recognition. Proceedings..., N. Y., 1973.
? А. А. Диментман, В. В. Максимов, О. Ю. Орлов.