Аналiз експертних систем, що використовують суб'ектинi ймовiрностi
ВСТУП
Експертна
система - це набір програм, що виконує
функції експерта при вирішенні
завдань з певної предметної області.
Експертні системи видають
За допомогою експертних систем можна швидко та якісно отримати пояснення на яке-небудь запитання, без дії впливу людського фактору. Так як важко зробити іноді висновок та прийти до вірного рішення одній, іноді некомпетентній, людині. Для цього існують спеціально розроблені програми, які будуються не однією особою, а великою кількістю експертів, кожен з яких вносить великий вклад в розвиток експертної системи. Та щоб система вміщала в себе широкий спектр рішень та пропозицій до неї вводять різноманітні вірогідності, які вказують на мінливість отриманого результату.
Експертні системи, що використовують теорію суб’єктивних ймовірностей, ґрунтуються на Байєсовському методі, методі Вальда, чи як ще його називають – метод послідовного статистичного аналізу, діагностичних таблицях Сано, методі лінійних дискримінативних функціях, та ін.
Використання суб'єктивних очікувань у байесових мережах є єдиною альтернативою на практиці, якщо необхідний облік думки експертів (наприклад, лікарів) про можливість настання події, до якого застосовується поняття повторюваності, а також неможливо його опис в термінах сукупності елементарних подій.
За
допомогою цих методів можна
розрахувати поширення
Експертні
системи, що використовують теорію суб’єктивних
ймовірностей, користуються великим попитом
серед експертних систем для пошуку рішень.
Ці експертні системи дозволяють швидко
та правдиво давати вірну відповідь на
різноманітні питання у вузькій предметній
області.
1 АНАЛІЗ ТЕОРІЇ
СУБ’ЄКТИВНИХ ЙМОВІРНОСТЕЙ
- Теорія суб’єктивних ймовірностей
Основне поняття ймовірності настільки природно, що воно відіграє значну роль у повсякденному житті. Розмови, що стосуються ймовірності дощу або гарного врожаю на городі часто зустрічаються в нашому житті. Поняття ймовірності було розроблено кілька сторіч назад. Але вже тисячі років людина використовує такі слова, як «може бути», «шанс», «удача» або інші їх еквіваленти в розмовній мові.
Однак математична теорія ймовірностей була сформульована відносно недавно (близько 1660 року). Імовірність події класично визначається як відношення випадків у які дана подія відбувається до загального числа спостережень.
Однак можливі й інші визначення. У цей час існує кілька інтерпретацій теорії ймовірностей. Розглянемо три найбільш домінуючих погляди.
Об’єктивістський погляд. Полягає в тому, що розглядає ймовірність відношення наслідків до всіх спостережень в ході тривалого часу. Іншими словами цей підхід заснований на законі великих чисел, що гарантують те, що при наявності досить великої кількості спостережень частота наслідків події, що цікавить, буде прагнути до об’єктивної ймовірності.
Персоніфікований,
суб’єктивістський або
Необхідний або логічний. Характеризується тим, що імовірнісна міра розширюється на множину тверджень, що мають логічний зв'язок такий, що істинність одного з них може виводитися з іншого. Іншими словами ймовірність вимірює ступень доведеності логічно вивіреного висновку. Такий погляд можна розглядати як розширення звичайної логіки.
Ці імовірнісні інтерпретації використовують і різні схеми висновку. Однак існує всього дві школи імовірнісних розрахунків: школа Паскаля (або загальноприйнята), школа Бекона (або індуктивна). Розрахунки за Паскалем використовують байєсовскі правила для перевірки й обробки мір довіри. Обчислення за Беконом використовують правила логіки для доказу або спростування гіпотез. Таким чином, загальноприйняті ймовірності (за Паскалем) не можуть бути отримані з індуктивних ймовірностей (за Беконом) і, навпаки. Об’єктивістський і суб’єктивний погляди використовують розрахунки за Паскалем. Ті, хто підтримують логічні висновки використовують розрахунки за Беконом.
Існують
експертні системи, побудовані на обох
з цих напрямків. Однак в експертних
системах бази знань накопичують
людські знання, тому для подання
знань експертів з урахуванням
ймовірностей найбільш підходящою є
інтерпретація на основі суб’єктивних
довір. У результаті чого й більшість
сучасних експертних систем, що використовують
теорію ймовірностей, є «байєсовськими»[1].
- Байєсівська стратегія як форма реалізації правил продукції
Введене в рамках медичної кібернетики поняття «медицинської пам'яті» та поширені в медичній практиці діагностичні таблиці, можна трактувати як бази фактів, які встановлюють залежність між симптомами (ознаками) і захворюваннями.
Структура таблиць зручна для реалізації загальної та диферен-ференціальной діагностики, яким властиві міркування виду "ознака ® захворювання", що реалізують "прямий" напрям логічних міркувань. При приватній діагностиці, коли потрібно перевірити наявність передбачуваного захворювання, реалізується "обернений" напрям міркувань "захворювання ® ознака" для перевірки наявності ознак, що підтверджують гіпотезу про наявність захворювання. Для цієї мети також можна використовувати таблиці вищенаведених типів, хоча, для скорочення часу пошуку інформації, їх можна трансформувати.
Разом з тим, таблиці «незручні» для ЕОМ, що оперують з числами. Вони незручні і для самих лікарів. Найбільш природним виходом з цієї ситуації представляється використання імовірнісної форми правила продукції. Тим більше, що при розробці алгоритмів медичної діагностики знайшли достатньо широке застосування:
• імовірнісний метод, що складається в обчисленні ймовірностей захворювань за формулою Байєса;
• метод послідовного статистичного аналізу Вальда;
• метод пошуку клінічного прецеденту.
З точки зору форми представлення кінцевого результату, принципової різниці між перерахованими методами немає - при практичній реалізації всі вони зводяться до оцінювання умовної ймовірності P (Yj / Xi), де Yj - найменування j-того захворювання, Xi - i-та ознака.
Витоки
такого підходу можна угледіти, по-перше,
в типах використовуваних в медицині,
психіатрії та психології шкал ознак
і нозологічних форм - це шкали найменувань,
для яких підрахунок частоти (імовірності)
чи не єдиний тип допустимих математичних
операцій. Друга причина - існування
добре розробленого математичного
апарату трансформації шкал найменувань,
іменованого формулою Байєса і забезпечує
оптимальність (у сенсі максимізації достовірності)
прийнятого рішення:
де P (Yj) і P (Xi) - апріорні ймовірності захворювання Yj та ознаки Xi;
P (Xi / Yj) - умовна ймовірність появи ознаки-симптому Xi для захворювання Yj;
P (Yj / Xi) - апостеріорна ймовірність захворювання Yj при спостереженні ознаки Xi.
Співвідношення
(1.1) є одним із правил бази правил
експертної системи, що розробляється
з використанням елементів
Відзначимо
властивість симетрії формули Байєса:
з (1.1) легко вивести співвідношення:
Зіставляючи (1.1) і (1.2), приходимо до висновку, що формула Байєса дозволяє практично за однією і тією ж схемою обчислень здійснювати висновки як у прямому ("ознаку ® захворювання"), так і в зворотному ("захворювання ® ознака") напрямках . Причиною тому - принципова особливість формули Байєса, яка встановлює зв'язок не між "причиною" і "слідством", а між двома довільними подіями. Співвідношення (1.2) можна, в принципі, використовувати для ранжування ознак окремих захворювань (при приватній діагностиці, наприклад). Крім того, зазначена властивість симетрії дозволяє трохи відійти від звичного відстеження причин і наслідків, згадавши про таке явище, як синхронізм явищ у природі (наприклад, один і той же спалах на Сонці може породити як загострення існуючих захворювань, так і послужити "спусковим гачком" для виникнення нових захворювань в ослабленому організмі, тому не слід поспішати оголошувати виявлення залежності як причинно-наслідкові залежності такого роду можуть бути відсутня).
Для
безлічі статистично незалежних
ознак X = (X1 ,..., XI) формулу Байєса
в рекурентному її варіанті
(1.3)
можна розглядати як своєрідний ланцюжок висновків наступного вигляду.
Нехай лікар спостерігає якусь ознаку X1. Виготовляючи обчислення за формулою (1.11), отримуємо апостеріорної розподіл ймовірностей P (Yj/X1), j = 1, ..., J, орієнтуючись на максимум якого можемо зробити висновок про наявність деякого захворювання Yj. Символічно правило продукції при цьому можна записати наступним чином: X1 ® Yj.
Однак значення апостеріорної ймовірності P (Yj/X1) при цьому може виявитися недостатньо високим для впевненого висновку про наявність захворювання. Тоді необхідно за результатами спостереження наступного ознаки X2 повторити обчислення за формулою (1.3), спостерігаючи за змінами максимуму апостеріорного розподілу ймовірностей P (Yj/X1, X2). У загальному випадку цей максимум може зміститися - тоді можемо зробити висновок про наявність іншого захворювання Yr. Схема виведення при цьому набуває вигляду, як показано на рис.1.1.
Рисунок
1.1 – Схема виведення, коли рівень
пошуку змінний
Така схема виведення справедлива для випадку, коли рівень пошуку незмінний, це може бути рівень класів захворювань при попередній діагностиці, або рівень нозологічних форм при загальній діагностиці, або рівні диференціальної діагностики.
При
переході до все більш детальної
діагностики відбувається зміна
рівнів, як показано на рис.1.2.
Рис.
1.2 – Схема виведення для випадку,
коли рівень пошуку незмінний
Зміна рівня діагностики, природно, приводить до зміни множин симптомів і відповідних їм захворювань. Ланцюжки міркувань, подібні наведеним вище, є прямими ланцюжками, що забезпечують просування від симптомів до захворювань.
Разом
з тим, при приватній діагностиці,
коли перевіряється припущення про
наявність деякого
- Правило продукції
Правило продукції "якщо А, то В" ("якщо є подія А, тоді є подія В") володіє безперечними перевагами перед іншими формалізмами, оскільки легко сприймається користувачами, зокрема, лікарями при вирішенні задачі діагностики. Схема міркувань при цьому, в першому наближенні, має вигляд: "якщо спостерігається сукупність ознак А, тоді з великою часткою ймовірності має місце група захворювань В".
Оскільки
в самому простому вигляді правило
продукції близько за змістом
логічної операції імплікації, для
правила продукції часто
А®В
або,
трактуючи А як сукупність деяких
заданих умов Pi, i = 1, 2, ... , N,
P1ÙP2Ù...ÙPn®
B,
де Ù - символ кон'юнкції.
Наведемо
приклад правил продукції, застосованих
в різних ЕС медичного призначення:
ЯКЩО: профіль щільності є "асиметричний гамма-пік"
і площа під кривою відповідає віковій нормі,
ТО: концентрація гамаглобуліну
у межах норми.
Неважко
бачити, що подія А в цьому прикладі
є кон'юнкція двох «елементарних» подій,
тому цей же приклад можна переписати
у вигляді:
ЯКЩО: профіль щільності є "асиметричний гамма-пік"
І
ЯКЩО: площа під кривою відповідає віковій нормі,
ТО: концентрація гамаглобуліну у межах норми.
Система продукцій зручна для вираження знань, які можуть приймати форму переходів між станами (ситуація ® дію, посилка ® висновок, причина ® слідство).
Розрізняють продукційні системи, керовані даними (передумовою правил) і продукційні системи, керовані цілями (діями правил).
База
знань продукційної ЕС складається
з безлічі правил продукції (бази правил)
і кінцевого набору фактів (бази фактів).
[4]
- Моделювання логічних міркувань
Говорячи про логічні міркування, можна було б очікувати, що під цим мається на увазі лише процес оперування з «медичною пам'яттю» (вихідними даними для такого оперування являються спостерігаючі симптоми). У цьому сенсі «медична пам'ять» є первинною, а логічні міркування - вторинні. Однак попередньо потрібно зауважити, що питання про «первинність» і «вторинність» на перевірку виявляється досить умовним - «стиль» мислення може мати значний вплив на структуру і характер «медицинської пам'яті».
Найбільше розповсюдження в медицині та психології отримали так звані табличні алгоритми ухвалення рішення - алгоритми, що базуються на обчисленнях з використанням таблиць виду 1.1-1.2. Підсумовуючи для спостережуваних ознак числа, наведені у стовпцях цих таблиць, отримують кілька сум. Діагноз ставлять, орієнтуючись на найбільшу суму.
Перевагами табличних алгоритмів є їх виняткова простота, що дозволяє обходитися без ЕОМ. Недолік - чутливість до ситуацій, коли деякі ознаки не виміряні з тих чи інших причин - може виявитися, що ці ознаки як раз є найбільш інформативними.
В
значній мірі вільні від цього
недоліку алгоритми, що використовують
імовірнісний підхід до прийняття рішення.
Обчислення при цьому здійснюються
за формулою Байєса або з використанням
методу послідовного статистичного аналізу
(методу Вальда). Порівняльна складність
обчислень передбачає використання ЕОМ.
Таблиця 1.1 – Розподіл вірогідностей захворювань від симптомів
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
При обчисленнях за формулою Байєса, як запобіжної достовірності висновку про наявність тієї або іншої патології, використовується умовна ймовірність P (Yj / Xi):
Для
безлічі ознак X = (X1 ,..., XI)
формула Байєса набуває вигляду:
(1.5)
або,
для статистично незалежних ознак,
Вирішальне правило при використанні формули Байєса полягає у пошуку максимуму функції P (Yj / X1 ,..., XI).
Зручніше
рекурентний варіант формули
Байєса:
,
(1.7)
що дозволяє проводити обчислення в міру оцінювання нових симптомів, не чекаючи моменту, коли будуть оцінені всі I симптомів. Цей принцип дозволяє припинити облік нових симптомів, якщо лікар вважатиме оцінку ймовірності аналізованої гіпотези досить високою. Слід лише пам'ятати, що формула (1.7) являє собою варіант формули (1.6), тобто математично коректна лише за умови статистичної незалежності ознак.
У
окремому випадку діагностики одного
з двох можливих захворювань і
в припущенні P (Y1) = P (Y2) справедливо
співвідношення:
яке
для статистично незалежних ознак
можна переписати у вигляді:
або,
після логарифмування,
=
=
=
.
(1.8)
У
рекурентній формі:
=
.
Вирішальне
правило в цьому випадку має
вигляд:
У поєднанні з виразом (1.9) це вирішальне правило можна трактувати таким чином: якщо після врахування чергового симптому знак величини uI не змінився, є підстави для припинення процесу діагностики. Хоча «для страховки» можна розглянути ще кілька симптомів, переконавшись, що величина uI дійсно продовжує віддалятися від граничного значення 0.
Недоліком такого роду міркувань є відсутність міри віддаленості величини uI від значення 0, що можна трактувати як можливість свавілля з боку особи, яка приймає рішення - що одному лікарю здасться достатнім, то іншому - ні.
Суть методу послідовного аналізу Вальда полягає в тому, що такий захід вводиться, в результаті чого замість (1.10) використовується вирішальне правило виду:
де величини a і b, що визначають межі «коридору» в межах 0, обчислюються виходячи із заданих значень ймовірностей помилок e1 і e2 - помилок прийняття рішення про захворювання Y1 при наявності захворювання Y2, і навпаки.
Крім того, Вальд строго математично довів доцільність впорядкування діагностичних ознак в порядку зменшення їх інформативності. Втім, теза про необхідність враховувати спочатку більш інформативні ознаки, а потім - менш інформативні, достатньо зрозумілий і на інтуїтивному рівні (з позицій "здорового глузду").
У
практичній діагностиці іноді
діагностики невеликої групи захворювань в певному лікувальному закладі в межах чітко вираженого відрізка часу. [5]
Покажемо тепер, що «стиль» мислення при прийнятті рішення дійсно позначається і на формі «медичної пам'яті». Відома, наприклад, діагностична таблиця Сано, що припускає проведення обчислень за формулою Байєса, з тією лише відмінністю, що завдяки логарифмування операція множення замінюється складанням (табл. 1.2).
Стосовно до методу послідовного статистичного аналізу можна використовувати «медичну пам'ять», представлену таблицею 1.3.
При
реалізації методу лінійних дискримінантний
функцій зручна медична пам'ять, показана
в табл. 1.4. Взагалі кажучи, метод лінійних
дискримінантний функцій призначений
для діагностики двох захворювань, сутність
його зводиться до пошуку рівняння площини
в багатовимірному просторі ознак. Площина
вибирають таким чином, щоб якість рішення
задачі діагностики було задовільним
у заздалегідь заданому значенні. Один
із способів розрахунку дискримінантний
коефіцієнтів ai описується співвідношенням:
де
-
умовне середнє
значення симптому Xi при захворюванні
Yj;
- сумарна
дисперсія симптому Xi при обох захворюваннях.
Таблиця 1.2 – Діагностична таблиця Сано
|

- Аналiз ефективностi реалiзацii iнвестецiйного проекту на пiдприэмствi
- Аналiз нацiональноi економiки
- Аналiз основних виробничих засобiв та iх використання (на прикладі ТОВ АФ «Надія» Голованівського району Кіровоградської області»)
- Аналiз ринку виробництва i торговлi фарфоровим посудом
- Аналiз ринку стацiонарного звязку Украiни та визначення споживчих потреб основних його сегментiв
- Аналiз рівня продуктивності праці на підприємстві ЗАТ "Ужгородська швейна фабрика"
- Аналiз ролi упаковки i ii розробка на пiдприэмствi "Контi"
- Анавлиз рентабельности
- Анадиз документооборота
- Аназиз внешней среды предприятия
- Аназиз кредитных рисков
- Аназиз ликвидности и платежеспособности
- Аназиз собственного и заемного капитала
- Анаилиз себестоимости продукции