Слухай Я. О. Дослідження архітектурних вимог до бази знань як сервісу // Міжнародний науковий журнал "Інтернаука". — 2018. — №8.
Інфoрмaцiйнi тeхнoлoгiї
УДК 000.04
Слухай Яна Олександрівна
магістр кoмп’ютeрних нaук
Нaцioнaльного тeхнiчного унiвeрcитeту Укрaїни
«Київcький пoлiтeхнiчний iнcтитут імені Ігоря Сікорського»
Слухай Яна Александровна
магистр кoмпьютeрных нaук
Нaциoнaльного тeхничecкого унивeрcитeта Укрaины
«Киeвcкий пoлитeхничecкий инcтитут имени Игоря Сикорского»
Slukhai Yana
Master of Computer Science of the
National Technical University of Ukraine
«Igor Sikorsky Kyiv Polytechnic Institute»
ДОСЛІДЖЕННЯ АРХІТЕКТУРНИХ ВИМОГ ДО БАЗИ ЗНАНЬ ЯК СЕРВІСУ
ИССЛЕДОВАНИЕ АРХИТЕКТУРНЫХ ТРЕБОВАНИЙ К БАЗЕ ЗНАНИЙ КАК СЕРВИСУ
THE KNOWLEDGE BASE AS A SERVICE ARCHITECTURAL REQUIREMENTS RESEARCH
Анoтaцiя. Досліджено основні вимоги до побудови бази знань як сервісу, проаналізовано переваги використання REST-архітектури для такої системи.
Ключoвi cлoвa: веб-сервіс, семантичний веб, REST, сховище триплетів, RDF-сховище.
Аннoтaция. Исследованы основные требования к построению базы знаний как сервису, проанализированы преимущества использования REST-архитектуры для такой системы.
Ключeвыe cлoвa: веб-сервис, семантический веб, REST, хранилище триплетов, RDF-хранилище.
Summary. The basic requirements for building a knowledge base as a service have been researched, the advantages of using REST-architecture for such a system have been analyzed.
Key words: web-service, semantic web, REST, triplestore, RDF store.
Все більш цікавими та різноманітними стають розробки у сфері автоматичного пошуку, збору і обробки інформації. Одним з провідних напрямків цієї галузі є сукупність технологій семантичного вебу. Побудова масштабовних, кросплатформних систем, які б дозволяли використовувати всі переваги семантичного вебу та сервісної архітектури є першочерговою задачею для дослідників пов’язаних даних. Ключевим поняттям цього процесу стає онтологія.
У загальних рисах під онтологією розуміється система понять деякої предметної області, яка представляється як набір сутностей, з'єднаних відношеннями. Онтології використовуються для формальної специфікації понять і відношень, які характеризують певну область знань. Перевагою онтологій як способу представлення знань є формалізована структура, яка спрощує комп'ютерну обробку [1].
У явному вигляді онтології використовуються як джерела даних для багатьох комп'ютерних програм (для інформаційного пошуку, аналізу текстів, вилучення знань та інших інформаційних процесів), дозволяючи більш ефективно обробляти складну і різноманітну інформацію [3, c. 37-38]. Цей спосіб представлення знань дозволяє додаткам розпізнавати ті семантичні відмінності, які є зрозумілими для людей, але не є відомими для комп'ютера. Повноцінна розробка онтологій в новому розумінні цього терміну почалася лише в кінці 90-х. Це досить нова і мало досліджена галузь прикладної лінгвістики.
RDF (Resource Description Framework) специфікація передбачає створення деякої множини ресурсів, для яких визначаються зв'язки [1]. RDF семантика має визначати онтологію конкретної предметної області. Саме онтології з кожним роком завойовують все більше застосування у вирішенні задач представлення знань, семантичноого представлення інформаційних ресурсів та їх пошуку.
Ресурсом в RDF може виступати будь-яка сутність - як інформаційна (наприклад, веб-ресурс чи зображення), так і неінформаційна (наприклад, тварина, вулиця чи якесь інше нематеріальне поняття). Ствердження, висловлене про ресурс, має вигляд "суб'єкт - предикат - об'єкт" і називається триплетом [2, c. 136-137]. Твердження «небо голубого кольору» в RDF-термінології можна представити наступним чином: суб'єкт - «небо», предикат - «має колір», об'єкт - «голубий». Для позначення суб'єктів, відношень і об'єктів у RDF використовуються URI [4, c. 44-45].
Все більш популярною стає сервісно-орієнтована архітектура (Service-oriented architecture, SOA) — архітектурний шаблон програмного забезпечення, модульний підхід до розробки програмного забезпечення, заснований на використанні розподілених, слабко пов'язаних замінних компонентів, оснащених стандартизованими інтерфейсами для взаємодії за стандартизованими протоколам.
Ідеї компонування сервісно-орієнтовної архітектури та семантичних сховищ є досить привабливими завдяки наданню користувачу досить зручного способу маніпулювання даними. Такі проекти зазвичай реалізуються за допомогою сховищ триплетів, до яких надається доступ згідно протоколів передачі даних, наприклад за допомогою HTTP.
Сховище триплетів (RDF-сховище) - це тип графічної бази, що зберігає семантичні факти. RDF, що означає Resource Description Framework, є моделлю для публікації та обміну даними в Інтернеті, стандартизований W3C [3, c. 39].
Сховища триплетів є більш гнучкими та менш дорогими, ніж, наприклад, реляційна база даних. RDF-сховище також може бути здатним обробляти потужні семантичні запити та використовувати логіку виведення для виявлення нової інформації поза існуючими відношеннями.
Важливим є вибір архітектурного стилю для проектування бази знань як сервісу. Порівнявши найбільш часто використовувані архітектури SOAP (Simple Object Access Protocol) та REST (Representational State Transfer), було визначено, що REST краще підходить для вирішення таких задач. Серед його переваг над SOAP можна виділити наступні:
Також цікавим є розгортання такої системи у хмарі, адже при використанні хмарних обчислень програмне забезпечення надається користувачеві як Інтернет-сервіс. Користувач має доступ до власних даних, але не може управляти і не повинен піклуватися про інфраструктуру, операційну систему і програмне забезпечення, з яким він працює.
Прикладні інформаційні системи можуть взаємодіяти з RDF-сховищем за допомогою спеціального API або структурованих SPARQL-запитів. SPARQL - це стандартна мова запитів до RDF-даних. Для найбільш ефективної роботи з базою знань за допомогою сервісу можна виділити такі вимоги:
Визначення вимог до бази знань як сервісу може значно скоротити час на вибір програмного забезпечення, бібліотек та фреймворків для її реалізації. Це також допоможе уникнути проблем при необхідності масштабувати чи розгортати систему у різноманітних (у тому числі хмарних) середовищах. Отже, дане дослідження є підґрунтям для подальшої реалізації бази знань як сервісу.
Література