Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем

У цій статті запропоновано розроблений автором метод нечіткої індукції як об'єднання положень нечіткої математики та теорії фракталів, введено поняття ступеня рекурсії нечіткої множини, представлено опис неповної рекурсії множини як її дробової розмірності для моделювання предметної галузі. Як сферу застосування запропонованого методу та створених на його основі моделей знань як нечітких множин розглянуто управління життєвим циклом інформаційних систем, включаючи розробку сценаріїв використання та тестування програмного забезпечення.

актуальність

У процесі проектування та розробки, впровадження та експлуатації інформаційних систем необхідно акумулювати та систематизувати дані, відомості та інформацію, що збираються ззовні або виникають на кожному етапі життєвого циклу програмного забезпечення. Це є необхідною інформаційно-методичною підтримкою проектних робіт та прийняття рішень та особливо актуально у ситуаціях високої невизначеності та у слабоструктурованих середовищах. База знань, що формується в результаті акумуляції та систематизації подібних ресурсів, має бути не лише джерелом корисного досвіду, отриманого проектною групою в ході робіт зі створення інформаційної системи, а й максимально простим засобом моделювання нових бачення, способів та алгоритмів реалізації проектних завдань. Іншими словами, така база знань є сховищем інтелектуального капіталу і водночас інструментом управління знаннями [3, 10].

Ефективність, корисність, якість бази знань як інструменту корелюють з ресурсомісткістю її ведення та результативністю отримання знань. Чим простіше і швидше збір і фіксація знань у базі і що більш пертинентні результати запитів до неї, краще і надійніше сам інструмент [1, 2]. Проте, дискретні методи та засоби структуризації, які застосовуються для систем управління базами даних, у тому числі нормалізація відносин реляційних баз даних, не дозволяють описувати чи моделювати смислові компоненти, інтерпретації, інтервальні та безперервні семантичні множини [4, 7, 10]. Для цього потрібен методологічний підхід, що узагальнює окремі випадки кінцевих онтологій і наближає модель знань до безперервності опису предметної галузі інформаційної системи.

Таким підходом може бути поєднання положень теорії нечіткої математики та поняття фрактальної розмірності [3, 6]. Оптимізуючи опис знань за критерієм ступеня безперервності (величині кроку дискретизації опису) в умовах обмеження за принципом неповноти Геделя (в інформаційній системі – принципової неповноти міркувань, знань, що виводяться з цієї системи за умови її несуперечності), виконуючи послідовну фазифікацію (приведення) отримуємо формалізований опис, який максимально повно і складно відображає певний масив знань і з яким при цьому можна виконувати будь-які операції інформаційних процесів - збирання, зберігання, обробку та передачу [5, 8, 9].

Визначення рекурсії нечіткої множини

Нехай X – безліч значень деякої характеристики системи, що моделюється:

Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем (1)

де n = [N ≥ 3] – кількість значень такої характеристики (більше, ніж елементарний набір (0; 1) – (брехня; істина)).
Нехай X = B, де B = {a,b,c,…,z} – безліч еквівалентів, поелементно відповідне безлічі значень характеристики X.
Тоді нечітка безліч Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем, що відповідає нечіткому (у загальному випадку) поняття, що описує характеристику X, може бути представлено у вигляді:

Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем (2)

де m – крок дискретизації опису, i належить N – кратність кроку.
Відповідно, щоб оптимізувати модель знань про інформаційну систему за критерієм безперервності (м'якості) опису, залишаючись у межах простору неповноти міркувань, запровадимо ступінь рекурсії нечіткої множини Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем і отримаємо наступний варіант його подання:

Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем (3)

де Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем – безліч, відповідне нечіткому поняття, у загальному випадку повніше описує характеристику X, ніж безліч Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем, За критерієм м'якості; Re – ступінь рекурсії опису.
Слід врахувати, що Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем (зводимо до чіткої множини) в окремому випадку при необхідності.

Введення дробової розмірності

При Re = 1 безліч Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем являє собою звичайне нечітке безліч 2-го ступеня, що включає як елементи нечіткі множини (або їх чіткі відображення), що описують всі значення характеристики X [1, 2]:

Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем (4)

Однак це вироджений випадок, і в найбільш повному поданні частина елементів Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем може бути множинами, тоді як інші – тривіальними (гранично простими) об'єктами. Тому для визначення такої множини необхідно ввести дробову рекурсію – аналог дробової розмірності простору (у цьому контексті – простору онтології деякої предметної області) [3, 9].

При Re дробовій отримуємо наступний запис Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем:

Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем (5)

де Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем – нечітка множина для значення X1, Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем – нечітка множина для значення X2 і т.д.

У такому разі рекурсія стає по суті фрактальною, а безлічі описів – самоподібними.

Визначення безлічі функціональних можливостей модуля

Архітектура відкритої інформаційної системи передбачає принцип модульності, що забезпечує можливість масштабування, реплікації, адаптивність та емерджентність системи. Модульна побудова дозволяє максимально наблизити технологічну реалізацію інформаційних процесів до їх природного об'єктивного втілення в реальному світі, розробляти найзручніші за своїми функціональними властивостями засоби, покликані не замінювати людей, а ефективно допомагати їм в управлінні знаннями.

Модуль є якоюсь відокремленою сутністю інформаційної системи, яка може бути обов'язковою або опціональною для цілей існування системи, але в будь-якому випадку забезпечує унікальний у межах системи набір функцій.

Все різноманіття функціональних можливостей модулів можна описати трьома типами операцій: створення (запис нових даних), редагування (зміна раніше записаних даних), видалення (прання раніше записаних даних).

Нехай X – певна характеристика таких функціональних можливостей, тоді відповідне безліч X можна у вигляді:

Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем (6)

де X1 - створення, X2 - редагування, X3 - видалення,

Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем (7)

При цьому функціональні можливості будь-якого модуля такі, що створення даних не самоподібне (реалізовано без рекурсії – функція створення не повторює саму себе), а редагування та видалення в загальному випадку можуть передбачати як поелементну реалізацію (виконання операції над обраними елементами множини даних), так і самі включати у складі подібні собі операції.

Слід зазначити, що якщо операція для функціональної можливості X в даному модулі не виконується (не реалізована в системі), то відповідна така операція безліч розглядається як порожня.

Таким чином, для опису нечіткого поняття (висловлювання) «модуль дозволяє виконати операцію з відповідним набором даних з метою інформаційної системи» нечітка множина Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем у найпростішому випадку можна уявити як:

Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем (8)

Така множина в загальному випадку має ступінь рекурсії рівну 1,6(6) і є фрактальним і нечітким одночасно.

Підготовка сценаріїв використання та тестування модуля

На етапах розробки та експлуатації інформаційної системи необхідні спеціальні сценарії, що описують порядок та зміст операцій для використання модулів за їх функціональним призначенням (сценарії використання, англ. use-case), а також для перевірки відповідності очікуваного та реального результатів роботи модулів (сценарії тестування, англ. .test-case).

З урахуванням уявлень, викладених вище, процес роботи над такими сценаріями можна описати в такий спосіб.

Для модуля формується нечітка множина Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем:

Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем (9)

де
Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем – нечітка множина для операції створення даних по функціональній можливості X;
Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем – нечітка множина для операції редагування даних з функціональної можливості X, при цьому ступінь рекурсії a (вкладення функції) є натуральним числом і в тривіальному випадку дорівнює 1;
Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем – нечітка множина для операції видалення даних по функціональній можливості X, при цьому ступінь рекурсії b (вкладання функції) є натуральним числом і в тривіальному випадку дорівнює 1.

Така множина описує, що саме (які об'єкти даних) створюють, редагують та/або видаляють за будь-якого варіанта використання модуля.

Потім складається набір сценаріїв використання Ux по функціональній можливості X для модуля, в кожному з яких описується, для чого (для якого бізнес-завдання) створюють, редагують та/або видаляють об'єкти даних, описані безліччю Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем, і в якому порядку:

Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем (10)

де n – кількість сценаріїв використання X.

Далі складають набір сценаріїв тестування Tx по функціональній можливості X для кожного сценарію використання модуля, що розглядається. У сценарії тестування описується, які значення даних та в якому порядку використовуються при виконанні сценарію використання, а також який результат має бути отриманий:

Метод нечіткої індукції та його застосування для моделювання знань та інформаційних систем (11)

де [D] – масив тестових даних, n – кількість сценаріїв тестування X.
В описаному підході кількість сценаріїв тестування дорівнює кількості відповідних сценаріїв використання, що дозволяє спростити роботу над їх описом та актуалізацією в міру розвитку системи. Крім того, такий алгоритм можна використовувати для автоматизації тестування програмних модулів інформаційної системи.

Висновок

Представлений метод нечіткої індукції може бути імплементований на різних стадіях життєвого циклу будь-якої модульної інформаційної системи як для накопичення описової частини бази знань, так і в роботі над сценаріями використання та тестування модулів.

Більш того, нечітка індукція допомагає синтезувати знання на основі отриманих нечітких описів подібно до «когнітивного калейдоскопа», в якому частина елементів залишаються чіткими і однозначними, в той час як інші за правилом самоподібності застосовують вказану в ступені рекурсії кількість разів для кожної безлічі відомих даних. У сукупності отримані нечіткі множини формують модель, яка може бути використана як для цілей інформаційної системи, так на користь пошуку нових знань взагалі.

Подібного роду методологія може бути віднесена до своєрідної форми «штучного інтелекту» з урахуванням того, що синтезовані множини не повинні суперечити принципу неповноти міркувань і покликані допомагати інтелекту людини, а не замінювати її.

Список літератури

  1. Борисов В.В., Федулов А.С., Зернов М.М., «Основи теорії нечітких множин». М.: Гаряча лінія - Телеком, 2014. - 88 с.
  2. Борисов В.В., Федулов А.С., Зернов М.М., "Основи теорії нечіткого логічного висновку". М.: Гаряча лінія - Телеком, 2014. - 122 с.
  3. Деменок С.Л., «Фрактал: між міфом та ремеслом». Спб: Академія дослідження культури, 2011. - 296 с.
  4. Заде Л., «Основи нового підходу до аналізу складних систем та процесів прийняття рішень»/«Математика сьогодні». М.: "Знання", 1974. - С. 5 - 49.
  5. Кранц С., «Мистлива природа математичного доказу». М.: Лабораторія знань, 2016. - 320 с.
  6. Маврікіді Ф.І., «Фрактальна математика та природа змін» / «Дельфіс», №54 (2/2008), http://www.delphis.ru/journal/article/fraktalnaya-matematika-i-priroda-peremen.
  7. Мандельброт Би., "Фрактальна геометрія природи". М.: Інститут комп'ютерних досліджень, 2002. - 656 с.
  8. «Основи теорії нечітких множин: Методичні вказівки», сост. Коробова І.Л., Дьяков І.А. Тамбов: Вид-во Тамб. держ. тех. Ун-та, 2003. - 24 с.
  9. Успенський В.А., "Апологія математики". М: Альпіна Нон-фікшн, 2017. - 622 с.
  10. Zimmerman HJ "Fuzzy Set Theory - and its Applications", 4th edition. Springer Seience + Business Media, New York, 2001. - 514 p.

Джерело: habr.com

Додати коментар або відгук