Аннотация: Задача распознания объекта изображения является одной из актуальных в современной цифровой обработки изображений. В статье рассматривается улучшение разработанного автором алгоритма распознавания простого объекта изображения. Усовершенствована система трейс-, диаметральных и круговых функционалов. В частности, разработан новый набор диаметральных функционалов, для более точного и быстро действенного распознавания.
Ключевые слова: контурный анализ, объект изображения, вершина угла, распознавание.
Технические науки
УДК 004.932
Козловский Антон Николаевич
магистр технических наук
Kazlouski A. M.
Master of Engineering Science
АЛГОРИТМ РАСПОЗНАВАНИЯ ПРОСТОГО ОБЪЕКТА ИЗОБРАЖЕНИЯ НА ОСНОВЕ СТОХАСТИЧЕСКОЙ ГЕОМЕТРИИ
PLAIN OBJECT RECOGNITION ALGORITHM IN IMAGE POCESSING BASED ON STOCHASTIC GEOMETRY
Аннотация: Задача распознания объекта изображения является одной из актуальных в современной цифровой обработки изображений. В статье рассматривается улучшение разработанного автором алгоритма распознавания простого объекта изображения. Усовершенствована система трейс-, диаметральных и круговых функционалов. В частности, разработан новый набор диаметральных функционалов, для более точного и быстро действенного распознавания.
Ключевые слова: контурный анализ, объект изображения, вершина угла, распознавание.
Summary: Pattern recognition is central problem of image processing. This paper presents the improved plain object recognition algorithm in image processing based on stochastic geometry developed by the author. The system of trace, circular and diametrical functionals has been reworked. In particular, developed a new set of diametrical functionals, for a more efficient and rapid recognition.
Keywords: contour analysis, image object, the vertex, pattern recognition.
Введение
Последние достижения в развитии технического зрения, а также аппаратного и программного обеспечения сделали возможным практическое использование различных автоматизированных систем, направленных на поддержку принятия решений. Как следствие, алгоритмы цифровой обработки изображений находят все более широкое применение в научных и прикладных исследованиях в различных областях. Одной из важнейших задач цифровой обработки изображений является разработка алгоритмов распознавания объекта изображения, что является ключевым этапом решения различных задач. Поэтому разработка алгоритма распознавания объекта изображения актуальна в научном и практическом плане.
Алгоритмы распознавания объекта изображения используются при решении задачи совмещении изображений, а также находят широкое применение в системах технического зрения.
Аффинное преобразование является частным случаем проективного преобразования (подгруппа) [1]. Поэтому аффинная инварианта не сохраняет свои свойства при условии проективного искажения, а проективная инварианта сохраняет их в случае аффинного искажения. Как следствие разработка алгоритма распознавания объекта изображения инвариантного относительно проективного искажения актуальна.
Целью статьи является улучшение разработанного автором алгоритма распознавания простого объекта изображения. Его отличительной особенностью является инвариантность относительно проективного искажения. Разработаны новые наборы диаметральных и круговых функционалов. Это обеспечивает более точное и быстро действенное распознавание.
Алгоритм распознавания простого объекта изображения
В основе разработанного автором алгоритма распознавания простого объекта изображения на основе стохастической геометрии (Ag. 1) [2] лежит представление вершины угла простого объекта изображения в качестве характерной черты формы его границы. Проективное преобразование сохраняет вершину угла, кроме случаев превращения угла преобразованием в угол 0, p и 2p (рад). Подробно математическая модель простого объекта изображения рассмотрена в работе [3].
Рассматриваемый алгоритм распознавания простого объекта изображения (Ag. 2) как и алгоритм Ag. 1 состоит из следующих шагов:
Шаг 1. Произвести нормализацию исходного изображения;
Шаг 2. Обнаружить вершину угла v простого объекта pl;
Шаг 3. Вычислить вектор признаков y простого объекта pl;
Шаг 4. Произвести классификацию простого объекта pl.
При этом действия, выполняемые на каждом шаге у алгоритмов Ag. 1 и Ag. 2 одинаковы. Рассмотрим шаг 3 алгоритма Ag. 2 более детально.
Характерной особенностью формируемого признака изображения (триплетный) является его структура в виде композиции трех функционалов: Π(I) = Φ◦P◦T(I◦l(j, p, t)), где каждый функционал (Φ, P и T) действует на функции одной переменной (j, p и t). Подробно теория триплетных признаков изображения рассмотрена в работе Н. Г. Федотова [4].
В рассматриваемом нами случае компактность и линейная разделимость классов достигаются путем анализа формы границы ΓW простого объекта pl на основе контурного анализа. Обработка трейс-трансформанты выполняется диаметральными функционалами, отвечающими за переход от обработки трейс-трансформант к круговым трансформантам. Оценка подобия изображений выполняется исходя из совпадения аппроксимативного представления круговых трансформант – плоских кривых с периодом 2π.
Матрица проекций (трейс-матрица) имеет следующие размеры:
Трейс-функционалы не изменились и остались теме же, что и у алгоритма Ag. 1. Это интеграл вдоль сканирующей прямой l и количество вершин углов v простого объекта pl.
Среднее арифметическое взвешенное выступает в качестве диаметрального функционала P. Эта величина находит свое практическое применение в физике (в частности, средняя скорость тела или центр масс) и экономике.
Аппроксимация круговой трансформанты выполняется на основе преобразования Уолша – Адамара. Преобразование Уолша – Адамара с упорядочиванием по Адамару инвариантно относительно циклического сдвига исходной последовательности. Мощность множества всех значений функции f(j) равна 41. Поэтому спектр преобразования Уолша – Адамара с упорядочиванием по Адамару состоит из 64 значений. Отметим, что учитываются значения всех спектральных коэффициентов, в отличии от алгоритма Ag. 1, который рассматривал 38 первых коэффициентов.
Ниже представлена разработанная автором система трейс-, диаметральных и круговых функционалов.
Трейс-функционалы:
Диаметральные функционалы:
Круговые функционалы:
Итого имеется 35 функционалов, формирующих вектор признаков y изображения из 64 элементов. Автором предложены следующие функционалы: T2, P1 и F1 – F32. Таким образом число признаков изображения уменьшено с 200 Ag. 1 до 64. Это обеспечивает лучшую линейную разделимость классов.
Разработанный алгоритм распознавания Ag. 2 обеспечивает точность распознавания относительно проективного искажения в среднем 92 %, а точность распознавания алгоритма Ag. 1 относительно проективного искажения в среднем 89 %. Сопоставление простого объекта pl выполняется с помощью классификатора по минимальному расстоянию, где мера близости простого объекта pl определяется манхэттенской метрикой. В ходе тестирования использовался разработанный автором алгоритм обнаружения вершины угла объекта изображения [5].
В качестве исходных данных для тестирования алгоритмов Ag. 1 и Ag. 2 использовалась база реальных аэрокосмических изображений, включающая 140 изображений, а также различные произвольные эталонные выборки простых объектов. Эталонная выборка S из семи произвольных простых объектов показана на рис. 1.
Заключение
Предложен улучшенный алгоритм распознавания простого объекта изображения на основе стохастической геометрии. В качестве диаметрального функционала выступает среднее арифметическое взвешенное, обладающее физическим смыслом. Учитываются значения всех спектральных коэффициентов преобразования Уолша – Адамара с упорядочиванием по Адамару. Разработанный алгоритм распознавания повышает точность распознавания относительно проективного искажения в среднем на 3 % с увеличением быстродействия.
Литература