Выпуск №6 (Июнь) / Выпуски журнала за 2016 год / Публикации журналов Издательского дома "Интернаука" / Internauka

Аннотация: Использование беспилотных летательных аппаратов (БПЛА) для проведения аэрофотосъемки является чрезвычайно актуальным направлением развития методов сбора геопространственных данных на сегодня. Особенно в военное время - для ведения разведки противника, однако существует возможность создания радиоэлектронных помех, что приводит к перехвату БПЛА, или его "ослепления". В данной работе исследованы методы автономной навигации по оптическим ориентирам.

Ключові слова: БПЛА, автономная навигация.

Отрасль науки: Технические науки

Скачать статью (pdf)

Технічні науки

УДК 62.519

Дичко Віктор Миколайович

студент

Київський Національний Технічний Університет «КПІ»

Ляхевич Сергій Володимирович

аспірант ІПСА

Київський Національний Технічний Університет «КПІ»

Дычко Виктор Николаевич

студент

Киевський Национальный Технический Университет «КПИ»

Ляхевич Сергей Владимирович

аспирант ИПСА

Киевський Национальный Технический Университет «КПИ»

Dychko V.

student

Kyiv National Technical University “KPI”

Liakhevych S.

postgraduate

Kyiv National Technical University “KPI”

ОПТИЧНА НАВІГАЦІЙНА СИСТЕМА БПЛА: ПОРІВНЯЛЬНИЙ АНАЛІЗ АЛГОРИТМІВ ЗНАХОДЖЕННЯ КЛЮЧОВИХ ТОЧОК

ОПТИЧЕСКАЯ НАВИГАЦИОННАЯ СИСТЕМА БПЛА: СРАВНИТЕЛЬНЫЙ АНАЛИЗ АЛГОРИТМОВ НАХОЖДЕНИЯ КЛЮЧЕВЫХ ТОЧЕК

OPTICAL NAVIGATION SYSTEM: KEY-POINTS FINDING ALGORITHMS COMPARATIVE ANALYSIS

Анотація: Використання безпілотних літальних апаратів (БПЛА) для проведення аерофотозйомки є надзвичайно актуальним напрямком розвитку методів збору геопросторових даних на сьогодні. Особливо у військовий час – для ведення розвідки супротивника,проте існує можливість створення радіоелектронних завад, що призводить до перехоплення БПЛА, або його “засліплення”. В даній роботі досліджені методи автономної навігації за оптичними оріентирами.

Ключові слова: БПЛА, автономна навігація.

Ключові слова: БПЛА, автономная навигация.

Abstract: The use of unmanned aerial vehicles (UAVs) for aerial photography is an extremely important area of geospatial data collection methods today. Especially in wartime - for reconnaissance of the enemy, but the creation of electronic interference that results in intercepting or "blinding" the UAV is possible . This paper investigated methods of autonomous navigation optical orientyramy.

Key words: UAV, autonomous navigation.

Вступ

Використання безпілотних літальних апаратів (БПЛА) для проведення аерофотозйомки є надзвичайно актуальним напрямком розвитку методів збору геопросторових даних на сьогодні. В мирні часи цю інформацію можна використовувати для пошуку лісових пожеж, моніторингу стану доріг та трубопроводів, а у військові – для ведення розвідки супротивника. Проте саме у військовий час проведення місій БПЛА обмежено через недоліки системи керування.

БПЛА можуть бути керовані оператором за допомогою пульта, проте такий підхід суттєво звужує радіус їхньої дії. Найбільш поширеними на сьогодні є автономні БПЛА, які при здійсненні своєї місії використовують координати GPS, проте існує можливість створення потенційним супротивником фальшивого сигналу GPS чи радіоелектронних завад, що призводить відповідно до перехоплення БПЛА, або його “засліплення”.

Одним з способів вирішення цієї проблеми є використання допоміжних систем, які будуть працювати на фізичних принципах, що відрізняються від принципів роботи основної навігаційної системи. У випадку, коли основна навігаційна система працює на базі сигналів GPS, допоміжною може бути оптична навігаційна система, яка визначає положення шляхом співставлення зображення, отриманого з відеокамери БПЛА з картою, що прошита в Базі знань БПЛА. Проте такий підхід містить ряд технічних труднощів. По-перше поточний ландшафт та той, що міститься на прошитій карті можуть відрізнятися, особливо якщо місія здійснюється в зоні бойових дій - об’єкти, такі як будівлі, дороги можуть бути знищені. По-друге, зазвичай висота, на якій здійснюють свої місії БПЛА та висота на якій здійснюється аерофотозйомка для формування прошитої карти суттєво відрізняються. Отже, необхідно співставляти зображення з урахуванням масштабування, проективного перетворення та часткової зміни об’єктів. Незважаючи на відмінності зображень, деякі частини залишаються незмінними, тому для розпізнавання спільних точок доцільно застосовувати алгоритми, які знаходять ключові точки зображень та їх дескриптори [1-4], за допомогою яких ці точки можна порівнювати.

Мета даної статті полягає в дослідженні та порівняльному аналізі алгоритмів знаходження ключових точок та їхніх дескрипторів з ціллю використання в оптичній системі навігації БПЛА.

Алгоритми виявлення ключових точок та співставлення дескрипторів
1. SIFT (Scale-invariant feature transform)

Алгоритм SIFT знаходить характеристики зображення, які інваріантні до масштабування зображення і обертання, та частково інваріантні до змін в освітленні і точки знімання 3D камери [1, 2]. Виявлені характеристики значно відрізняються одна від одної, що дозволяє з високою ймовірністю коректно знайти відповідність між однаковими характеристиками та різних зображеннях, забезпечуючи основу для розпізнавання об’єктів.

Алгоритм включає такі основні етапи:

Знаходження екстремумів у просторі масштабів. На першому етапі відбувається пошук по всіх масштабах і розташуваннях на зображенні. Він реалізується, за допомогою функції різниці гаусіанів для виявлення потенційних точок які не залежать від масштабу і орієнтації.

Простір масштабів зображення визначається як функція , що отримується як згортка гаусіана зі змінним масштабом та вхідного зображення :

де – операція згортки на і , і

Функція згортки різниці гаусіанів із зображенням , що може бути обчислена як різниця двох сусідніх масштабів, розділених константним множником :

Локалізація ключових точок. Для кожного місцерозташування точки-кандидата знаходиться детальна модель для визначення розташування і масштабу. Ключові точки вибираються на основі міри їх стійкості.
Визначення орієнтації. На основі локальних напрямків градієнта кожній ключовій точці призначаються одна чи декілька орієнтацій. Всі подальші операції виконуються на даних зображення, які були перетворені по відношенню до призначеної орієнтації, масштабу і місцеположення кожної характеристики, забезпечуючи тим самим інваріантність цих перетворень.

Масштаб ключової точки використовується для того, щоб вибрати зображення , згладжене гаусіаном. Для кожного зразка зображення , значення градієнта і орієнтація обчислюється як різниця пікселів:

Дескриптори ключових точок. В області навколо кожної характерної точки вимірюються локальні градієнти зображення в обраному масштабі. Вони перетворюються в представлення, що дозволяє значні спотворення локальних форм і зміни освітлення [2].

Рисунок 1 – Дескриптор ключової точки

SURF (Speeded Up Robust Features)

Алгоритм SURF базується на таких самих принципах і кроках, як і SIFT, але конкретна реалізація на кожному кроці відрізняється [3]. Алгоритм має три основні частини: виявлення характерних точок, опис і співставлення характеристик локального околу.

Виявлення ключових точок

SURF використовує детектор на основі матриці Гессе для знаходження ключових точок. Визначник матриці Гессе використовується в якості міри локальної зміни навколо точки. Обираються точки, де цей визначник максимальний. SURF також використовує визначник матриці Гессе для вибору масштабу.

Матриця Гессе в точці зображення масшатабу визначається наступним чином:

де – згортка похідної гаусіана другого порядку із зображенням в точці . Аналогічно для і .

В алгоритмі використовуються квадратні фільтри, що апроксимують похідні гаусіана другого порядку і можуть бути розраховані дуже швидко за допомогою інтегрального представлення зображення, незалежно від розміру.

Рисунок 2 – Зліва на право: (дискретизовані і обрізані) часткові похідні гаусіана другого порядку в напрямках , і їх апроксимація за допомогою квадратних фільтрів. Сірі області дорівнюють нулю.

Дескриптори

Дескриптор SURF базується на подібних до SIFT властивостей, але при цьому має ще меншу складність. Перший крок складається з фіксації відтворюваної орієнтації на основі інформації з кругової області навколо ключової точки. Далі будується квадратна область, вирівняна до вибраної орієнтації, з якої отримується SURF-дескриптор.

ASIFT (Affine-SIFT)

ASIFT імітує з достатньою точністю всі спотворення викликані варіацією направлень оптичної осі камери [4]. Потім застосовується метод SIFT. Іншими словами, ASIFT імітує три параметри: масштаб, кут довготи камери і кут широти і нормалізує інші (поворот і зміщення).

ASIFT включає наступні кроки:

Кожне зображення перетворюється шляхом імітації всіх можливих афінних перетворень спричиненими зміною орієнтації оптичних осей камери з фронтальної позиції. Ці перетворення залежать від двох параметрів: довготи і широти .
Ці повороти і нахили виконуються для кінцевої і невеликої кількості кутів широти і довготи, кроки дискретизації цих параметрів забезпечують, що модельовані зображення ближчі до будь-якого іншого можливого зображення згенерованого за допомогою інших значень і .
Усі змодельовані зображення порівнюються за допомогою алгоритму співставлення (SIFT). [4]

Алгоритм співставлення зображень

Для співставлення супутникових знімків, що зроблені з різних позицій та мають спотворення перспективи і деякі локальні спотворення, такі як зміна будинків, доріг, дерев (наприклад, у залежності від пори року) та ін. будемо використовувати алгоритми SIFT, SURF, ASIFT як базові.

Алгоритм співставлення знімку та зображення зі супутника складається з наступних етапів.

Знаходження ключових точок на обох зображеннях.

Приклад знаходження ключових точок за допомогою алгоритмів SIFT, SURF, ASIFT на повному зображенні, яке необхідно перетворити (роздільна здатність: 500x667 пікселів) представлено на рисунку 3. Під час дослідження використовувалися зображення з роздільною здатністю 1944х2592 із значно більшою кількістю ключових точок.

Рисунок 3 – Ключові точки (SIFT, SURF, ASIFT)

Дослідження показало, що при класичному застосуванні SIFT, SURF та ASIFT, тобто при спробі знаходження перетворення зображення на основі всіх знайдених точок, результат виходить незадовільний внаслідок великої кількості неправильних співставлень точок. Приклад співставлення усіх точок зображень показано на рисунку 4.

Рисунок 4 – Співставлення всіх ключових точок

Виділення областей відповідностей

Внаслідок помилок співставлення всіх точок, описаних на етапі 1, для подальшої роботи алгоритму запропоновано на другому кроці алгоритму співставлення виділити декілька (2-4) відповідних областей на парі зображень. Приклад виділення областей показано на рисунках 8 та 12.

Виключення із подальшого розгляду всіх ключових точок, що не потрапили у відповідні області.

На даному етапі всі ключові точки, що не потрапили у відповідні області виключалися із розгляду, таким чином, зменшуючи кількість неправильних співставлень. Приклад зображень з співставленими ключовими точками на виділених областях отриманими за допомогою алгоритму ASIFT наведено на рисунку 5.

Рисунок 5 – Відповідні області та співставлення ключових точок

Знаходження проективного перетворення (перетворення гомографії) одного зображення до іншого на основі відповідних точок обох зображень.

Відображення точок двовимірної плоскої поверхні на зображення камери є прикладом гомографії. Це відображення можна виразити в термінах множення матриць при використанні однорідних координат, щоб виразити спостережувану точку і точку на зображенні , у яку відображається. Гомографія може бути виражена як , де , , де – масштабний коефіцієнт.

Приклад знаходження перетворення гомографії для зображення знімку представлено на рисунку 6 (посередині).

Накладання зображень.

Результуюче зображення отримується як зважена сума отриманого після перетворення гомографії та зображення зі супутника. Приклад представлено на рисунку 6.

Рисунок 6 – Зліва на право – оригінальне зображення, перетворене та результат накладання

Процедура визначення якості перетворення зображення складається з наступних кроків:

Загальна перевірка коректності перетворення.

На цьому етапі перевіряється наявність дзеркального відбиття для пар вершин зображення по горизонталі та вертикалі. При його наявності, якість перетворення зображення встановлюється рівною нулю. В іншому випадку якість розраховується, як описано нижче (етап 2, 3). Приклад некоректного перетворення з нульовою якістю наведено на рисунках 10 та 14 (перші зображення).

Виділення спільної прямокутної області.

Після перетворення гомографії змінюється форма зображення. Тому, для порівняння потенційно подібних частин зображень, на перетвореному зображенні виділялась прямокутна область. Приклад виділення такої області наведено на рисунку 7.

Рисунок 7 – Виділення внутрішньої прямокутної області

Знаходження значення SSIM (Structure similarity)

Якість коректного перетворення (ступінь подібності перетвореного зображення до зображення зі супутника) вимірювалась за допомогою SSIM.

Відмінною особливістю індексу структурної подібності (SSIM) є те, що метод враховує «сприйняття помилки» завдяки врахуванню структурної зміни інформації. Ідея полягає в тому, що пікселі мають сильний взаємозв’язок, особливо коли вони близькі просторово. Дані залежності містять важливу інформацію про структуру об’єктів і про зображення загалом. Метрика SSIM розрахована на різні розміри вікна. Різниця між двома вікнами і , що мають однаковий розмір :

де

– середнє

– дисперсія

– коваріація і

– динамічний діапазон пікселів (зазвичай )

, – константи. [5]

Приклади обчислення значень SSIM для різних зображень представлено на рисунках 10, 11, 14, 15.

3. Аналіз результатів дослідження порівняння алгоритмів

В якості вибірки для порівняльного аналізу використовувалися зображення, зняті з БПЛА в зоні донецького аеропорту, в якості карти використовувалася карта Google. При проведенні дослідження, на кожному зображенні виділялись відповідні області, які потім подавались на вхід вищеописаному алгоритму для перетворення зображення.

Для кожного експерименту та кожного набору областей застосовувалося зміщення кожної області (на 20% від розміру області) для кожного з чотирьох діагональних напрямків. Зміщення застосовувалося до областей зображення, яке необхідно перетворити; області зображення супутника залишалися незмінними. Середня якість чутливості – середня якість для перетворених зображень, для областей яких застосовувалося таке зміщення.

Також, експерименти проводилися для збільшених розмірів областей на 75%. Результати представлені в стовпці «Середня якість зі збільшеними областями».

В таблицях 1 та 3 наведено час виявлення ключових точок для різних експериментів, що є важливим при побудові систем реального часу. В таблицях 2 та 4 представлені дані щодо якості накладання зображень в залежності від обраного алгоритму та кількості областей співставлення.

Експеримент №1

Розглянемо приклад пари зображень із двома виділеними областями наведений на Рисунку 8.

Рисунок 8 – Зображення з виділеними відповідними областями

Таблиця 1 – Час виявлення ключових точок

Алгоритм	Час виявлення ключових точок (сек.)	Час співставлення дескрипторів (сек.)
SIFT	12,12	2,915
SURF	4,183	1,406
ASIFT	252,762	21,205

Таблиця 2 – Якість накладання зображень

Алгоритм	Кількість областей	Кількість експериментів	Середня якість	Максимальна якість	Відсоток з перетворень з ненульовою якістю	Середня якість чутливості	Середня якість зі збільшеними областями
SIFT	2	10	0,00	0,00	0,00	0,00	0,05
	3	10	0,17	0,59	0,40	0,02	0,06
	4	5	0,00	0,00	0,00	0,08	0,22
SURF	2	10	0,05	0,49	0,10	0,00	0,00
	3	10	0,28	0,58	0,50	0,04	0,12
	4	5	0,57	0,58	1,00	0,16	0,43
ASIFT	2	10	0,34	0,61	0,70	0,29	0,37
	3	10	0,50	0,58	0,90	0,46	0,44
	4	5	0,57	0,58	1,00	0,56	0,57

З графіків представлених на рисунку 9 можна побачити, що найкращу якість дає алгоритм ASIFT, проте при 4 областях його результати та результати SURF близькі.

Рисунок 9 – Порівняння якості співставлення зображень (рисунок 8) різних алгоритмів виділення ключових точок з різною кількістю виділених областей

На Рисунках 10 та 11 наведено приклади перетворення зображень із різною якістю.

Рисунок 10 – Приклади перетворення зображень з різною якістю. Зліва на право: 0; 0,47

Рисунок 11 – Приклади перетворення зображень з різною якістю. Зліва на право: 0,50; 0,57

Експеримент №2

Дослідимо ще один приклад пари зображень із двома виділеними областями наведений на Рисунку 12.

Рисунок 12 – Зображення з виділеними відповідними областями

Таблиця 3 – Час виявлення ключових точок

Алгоритм	Час виявлення ключових точок (сек.)	Час співставлення дескрипторів (сек.)
SURF	4,144	0,964
ASIFT	271,837	47,62

Таблиця 4 – Якість накладання зображень

Алгоритм	Кількість областей	Кількість експериментів	Середня якість	Максимальна якість	Відсоток з перетворень з ненульовою якістю	Середня якість чутливості	Середня якість зі збільшеними областями
SURF	2	10	0,00	0,00	0,00	0,00	0,04
	3	10	0,00	0,00	0,00	0,03	0,21
	4	5	0,00	0,00	0,00	0,10	0,23
ASIFT	2	10	0,30	0,63	0,50	0,23	0,18
	3	10	0,56	0,66	0,90	0,55	0,64
	4	5	0,65	0,66	1,00	0,64	0,52

Результати для SIFT вийшли нульові і не були внесені в таблицю 4. Зважаючи на якість роботи SURF, на рисунку 13 наведено порівняння якості співставлення в залежності від кількості виділених областей лише для ASIFT.

Рисунок 13 – Порівняння якості співставлення зображень (рисунок 12) з різною кількістю виділених областей

На Рисунках 14 та 15 наведено приклади перетворення зображень із різною якістю.

Рисунок 14 – Приклади перетворення зображень з різною якістю. Зліва на право: 0; 0,53

Рисунок 15 – Приклади перетворення зображень з різною якістю. Зліва на право: 0,63; 0,66

Отже, за результатами досліджень найкраща якість досягається при використанні алгоритму знаходження ключових точок ASIFT та при кількості виділених відповідних областей, що дорівнює 4. При цьому не спостерігається значного погіршення якості навіть для зображень з поворотом відносно зображення із супутника. Недоліком використання алгоритму ASIFT є його швидкість, використовувати його в системах реального часу не є доцільним. Пропонується використовувати ASIFT для співставлення карти з лише певним базовим зображенням з БПЛА, а з інших фото з БПЛА створювати панораму за допомогою SURF.

Розглянемо структуру оптичної навігаційної системи, побудованої на основі запропонованого алгоритму (Рисунок 16).

4 Оптична навігаційна система

За допомогою драйвера відеокамери система отримує базове зображення. Оператор виділяє на зображенні та карті 4 області співставлення. Базове зображення та карта накладаються за допомогою ASIFT. Нові зображення з БПЛА зшиваються між собою (SURF) та на основі перетворення, отриманого з накладання карти та базового зображення співставляються з картою з метою отримання координат. Маючи координати, система може сформувати маршрут руху.

Рисунок 16 - Основні компоненти оптичної навігаційної системи БПЛА

Висновки

В ході роботи було запропоновано структуру оптичної системи навігації БПЛА та алгоритм співставлення зображень який може бути в ній використаний. Запропонована система дозволяє вирішити проблеми навігації на основі пульту чи GPS і забезпечує можливість БПЛА здійснити свою місію як в мирний так і військовий час.

При аналізі запропонованого алгоритму співставлення знімків з БПЛА та супутникових зображень було визначено, що найкраща якість досягається при використанні алгоритму знаходження ключових точок ASIFT для базового зображення та при кількості виділених відповідних областей, що дорівнює чотирьом. При цьому не спостерігається значного погіршення якості навіть для зображень з поворотом відносно зйомки із супутника.

Подальші дослідження плануються щодо автоматизації вибору областей співставлення, модифікації алгоритму для підвищення якості перетворення зображень та застосування комбінацій алгоритмів для підвищення швидкості роботи.

Список літератури

Lowe D. G. Object Recognition from Local Scale-Invariant Features / D. G. Lowe // International conference on Computer Vision. – 1999. – P. 1150-1157.
Lowe D.G. Distinctive Image Features from Scale-Invariant Keypoints / D.G. Lowe // International Journal of Computer Vision. – 2004. – Vol. 60, № 2. – Р. 91-110.
Bay H. Surf: Speeded up robust features / H. Bay, T. Tuytelaars, L. Van Gool // European Conference on Computer Vision. – 2006. – P. 1:404-417.
Morel J. ASIFT: A New Framework for Fully Affine Invariant Image Comparison / J. Morel, G. Yu // SIAM Journal on Imaging Sciences – 2009. – Vol. 2, №2. – P. 438-469.
Wang Z. Image Quality Assessment: From Error Measurement to Structural Similarity / Z. Wang, A. C. Bovik, H. R. Sheikh, E. P. Simoncelli // IEEE Transactions on image processing. – 2004. - Vol. 13, № 1. – P. 600-612.