Аналiз експертних систем, що використовують суб'ектинi ймовiрностi

ВСТУП 

      Експертна система - це набір програм, що виконує  функції експерта при вирішенні  завдань з певної предметної області. Експертні системи видають поради, проводять аналіз, дають консультації. Практичне застосування експертних систем на підприємствах сприяє ефективності роботи та підвищенню кваліфікації фахівців.

      За  допомогою експертних систем можна  швидко та якісно отримати пояснення  на яке-небудь запитання, без дії  впливу людського фактору. Так як важко зробити іноді висновок та прийти до вірного рішення одній, іноді некомпетентній, людині. Для  цього існують спеціально розроблені програми, які будуються не однією особою, а великою кількістю експертів, кожен з яких вносить великий  вклад в розвиток експертної системи. Та щоб система вміщала в себе широкий спектр рішень та пропозицій до неї вводять різноманітні вірогідності, які вказують на мінливість отриманого результату.

      Експертні системи, що використовують теорію суб’єктивних ймовірностей, ґрунтуються на Байєсовському методі, методі Вальда, чи як ще його називають – метод послідовного статистичного аналізу, діагностичних таблицях Сано, методі лінійних дискримінативних функціях, та ін.

      Використання  суб'єктивних очікувань у байесових мережах є єдиною альтернативою на практиці, якщо необхідний облік думки експертів (наприклад, лікарів) про можливість настання події, до якого застосовується поняття повторюваності, а також неможливо його опис в термінах сукупності елементарних подій.

      За  допомогою цих методів можна  розрахувати поширення ймовірності  в експертних системах, що є більш  зручним методом для розрахунку, аніж припустимо за допомогою статистичних функцій. За допомогою байесовської теорії можна розрахувати вірогідність того чи іншого судження, в якому не впевнені. Тобто, вірогідність визначається як ступінь впевненості в істинності судження. Але яким би не здавався цей метод хорошим існують деякі негативні аспекти у використанні цієї теорії. Так наприклад психологічно експерту в багатьох випадках важко залишатись в рамках строгого математичного апарату теорії ймовірностей, яка по своїй природі носить об’єктивний характер. Необхідно порушувати жорстокі умови рівності одиниці сум вірогідностей всіх можливих станів, особливо при їх великій кількості. В багатьох випадках реально спостерігаючі свідоцтва підтверджують не який-небудь певний результат (чи гіпотезу), а відразу ж деяку множину, що не дозволяє визначити вірогідність кожного з них. Якщо експерт оцінює величини, мають вельми неясний сенс, властивості яких у багатьох випадках не збігаються зі звичними уявленнями, можна зіткнутися з тим, що її відповіді не будуть нести корисної інформації про оцінювані величини.

      Експертні системи, що використовують теорію суб’єктивних ймовірностей, користуються великим попитом серед експертних систем для пошуку рішень. Ці експертні системи дозволяють швидко та правдиво давати вірну відповідь на різноманітні питання у вузькій предметній області.  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

1 АНАЛІЗ ТЕОРІЇ  СУБ’ЄКТИВНИХ  ЙМОВІРНОСТЕЙ 
 

    1. Теорія  суб’єктивних ймовірностей
 

     Основне поняття ймовірності настільки  природно, що воно відіграє значну роль у повсякденному житті. Розмови, що стосуються ймовірності дощу або  гарного врожаю на городі часто зустрічаються  в нашому житті. Поняття ймовірності  було розроблено кілька сторіч назад. Але вже тисячі років людина використовує такі слова, як «може бути», «шанс», «удача» або інші їх еквіваленти  в розмовній мові.

     Однак математична теорія ймовірностей була сформульована відносно недавно (близько 1660 року). Імовірність події класично визначається як відношення випадків у які дана подія відбувається до загального числа спостережень.

     Однак можливі й інші визначення. У цей  час існує кілька інтерпретацій  теорії ймовірностей. Розглянемо три  найбільш домінуючих погляди.

     Об’єктивістський  погляд. Полягає в тому, що розглядає  ймовірність відношення наслідків  до всіх спостережень в ході тривалого  часу. Іншими словами цей підхід заснований на законі великих чисел, що гарантують те, що при наявності  досить великої кількості спостережень частота наслідків події, що цікавить, буде прагнути до об’єктивної ймовірності.

     Персоніфікований, суб’єктивістський або заснований на судженнях погляд.  Полягає  в тому, що імовірнісна міра розглядається  як ступінь довіри того, як окрема особистість  судить про істинність деякого висловлення. Цей погляд постулує, що дана особистість має в деякому смислі відношення до цієї події. Але це не заперечує можливості того, що дві прийнятні особистості можуть мати різні ступені довіри для того самого судження. Термін «байєсовський» часто використовується як синонім суб’єктивної ймовірності.

     Необхідний  або логічний. Характеризується тим, що імовірнісна міра розширюється на множину тверджень, що мають логічний зв'язок такий, що істинність одного з  них може виводитися з іншого. Іншими словами ймовірність вимірює  ступень доведеності логічно  вивіреного висновку. Такий погляд можна розглядати як розширення звичайної  логіки.

     Ці  імовірнісні інтерпретації  використовують і різні схеми висновку. Однак  існує всього дві школи імовірнісних розрахунків: школа Паскаля (або  загальноприйнята), школа Бекона (або  індуктивна). Розрахунки за Паскалем використовують байєсовскі правила для перевірки й обробки мір довіри. Обчислення за Беконом використовують правила логіки для доказу або спростування гіпотез. Таким чином, загальноприйняті ймовірності (за Паскалем) не можуть бути отримані з індуктивних ймовірностей (за Беконом) і, навпаки. Об’єктивістський і суб’єктивний погляди використовують розрахунки за Паскалем. Ті, хто підтримують логічні висновки використовують розрахунки за Беконом.

     Існують експертні системи, побудовані на обох з цих напрямків. Однак  в експертних системах бази знань накопичують  людські знання, тому для подання  знань експертів з урахуванням  ймовірностей найбільш підходящою є  інтерпретація на основі суб’єктивних довір. У результаті чого й більшість  сучасних експертних систем, що використовують теорію ймовірностей, є «байєсовськими»[1]. 

    1. Байєсівська стратегія як форма реалізації правил продукції
 

     Введене в рамках медичної кібернетики поняття  «медицинської пам'яті» та поширені в медичній практиці діагностичні таблиці, можна трактувати як бази фактів, які встановлюють залежність між симптомами (ознаками) і захворюваннями.

     Структура таблиць зручна для реалізації загальної  та диферен-ференціальной діагностики, яким властиві міркування виду "ознака ® захворювання", що реалізують "прямий" напрям логічних міркувань. При приватній діагностиці, коли потрібно перевірити наявність передбачуваного захворювання, реалізується "обернений" напрям міркувань "захворювання ® ознака" для перевірки наявності ознак, що підтверджують гіпотезу про наявність захворювання. Для цієї мети також можна використовувати таблиці вищенаведених типів, хоча, для скорочення часу пошуку інформації, їх можна трансформувати.

     Разом з тим, таблиці «незручні» для  ЕОМ, що оперують з числами. Вони незручні і для самих лікарів. Найбільш природним виходом з цієї ситуації представляється використання імовірнісної форми правила продукції. Тим  більше, що при розробці алгоритмів медичної діагностики знайшли достатньо  широке застосування:

     • імовірнісний метод, що складається  в обчисленні ймовірностей захворювань  за формулою Байєса;

     • метод послідовного статистичного  аналізу Вальда;

     • метод пошуку клінічного прецеденту.

     З точки зору форми представлення  кінцевого результату, принципової  різниці між перерахованими методами немає - при практичній реалізації всі  вони зводяться до оцінювання умовної  ймовірності P (Yj / Xi), де Yj - найменування j-того захворювання, Xi - i-та ознака.

     Витоки  такого підходу можна угледіти, по-перше, в типах використовуваних в медицині, психіатрії та психології шкал ознак  і нозологічних форм - це шкали найменувань, для яких підрахунок частоти (імовірності) чи не єдиний тип допустимих математичних операцій. Друга причина - існування  добре розробленого математичного  апарату трансформації шкал найменувань, іменованого формулою Байєса і забезпечує оптимальність (у сенсі максимізації достовірності) прийнятого рішення: 

                                                (1.1) 

де P (Yj) і P (Xi) - апріорні ймовірності захворювання Yj та ознаки Xi;

P (Xi / Yj) - умовна ймовірність появи ознаки-симптому Xi для захворювання Yj;

P (Yj / Xi) - апостеріорна ймовірність захворювання Yj при спостереженні ознаки Xi.

     Співвідношення (1.1) є одним із правил бази правил  експертної системи, що розробляється  з використанням елементів байєсівської стратегії.

     Відзначимо  властивість симетрії формули Байєса: з (1.1) легко вивести співвідношення: 

                                                 (1.2) 

     Зіставляючи (1.1) і (1.2), приходимо до висновку, що формула Байєса дозволяє практично за однією і тією ж схемою обчислень здійснювати висновки як у прямому ("ознаку  ® захворювання"), так і в зворотному ("захворювання ® ознака") напрямках . Причиною тому - принципова особливість формули Байєса, яка встановлює зв'язок не між "причиною" і "слідством", а між двома довільними подіями. Співвідношення (1.2) можна, в принципі, використовувати для ранжування ознак окремих захворювань (при приватній діагностиці, наприклад). Крім того, зазначена властивість симетрії дозволяє трохи відійти від звичного відстеження причин і наслідків, згадавши про таке явище, як синхронізм явищ у природі (наприклад, один і той же спалах на Сонці може породити як загострення існуючих захворювань, так і послужити "спусковим гачком" для виникнення нових захворювань в ослабленому організмі, тому не слід поспішати оголошувати виявлення залежності як причинно-наслідкові  залежності такого роду можуть бути відсутня).

     Для безлічі статистично незалежних ознак X = (X1 ,..., XI) формулу Байєса в рекурентному її варіанті  

     

                                (1.3)  

     можна розглядати як своєрідний ланцюжок висновків  наступного вигляду.

     Нехай лікар спостерігає якусь ознаку X1. Виготовляючи обчислення за формулою (1.11), отримуємо апостеріорної розподіл ймовірностей P (Yj/X1), j = 1, ..., J, орієнтуючись на максимум якого можемо зробити висновок про наявність деякого захворювання Yj. Символічно правило продукції при цьому можна записати наступним чином: X1 ® Yj.

     Однак значення апостеріорної ймовірності P (Yj/X1) при цьому може виявитися недостатньо високим для впевненого висновку про наявність захворювання. Тоді необхідно за результатами спостереження наступного ознаки X2 повторити обчислення за формулою (1.3), спостерігаючи за змінами максимуму апостеріорного розподілу ймовірностей P (Yj/X1, X2). У загальному випадку цей максимум може зміститися - тоді можемо зробити висновок про наявність іншого захворювання Yr. Схема виведення при цьому набуває вигляду, як показано на рис.1.1.

     

     Рисунок 1.1 – Схема виведення, коли рівень пошуку змінний 

     Така  схема виведення справедлива  для випадку, коли рівень пошуку незмінний, це може бути рівень класів захворювань  при попередній діагностиці, або  рівень нозологічних форм при загальній  діагностиці, або рівні диференціальної  діагностики.

     При переході до все більш детальної  діагностики відбувається зміна  рівнів, як показано на рис.1.2.  

      

     Рис. 1.2 – Схема виведення для випадку, коли рівень пошуку незмінний 

     Зміна рівня діагностики, природно, приводить  до зміни множин симптомів і відповідних  їм захворювань. Ланцюжки міркувань, подібні  наведеним вище, є прямими ланцюжками, що забезпечують просування від симптомів  до захворювань.

     Разом з тим, при приватній діагностиці, коли перевіряється припущення про  наявність деякого захворювання, виникає необхідність у використанні зворотних ланцюжків міркувань. При цьому обчислення виробляються з використанням співвідношень, подібних[3].  

    1. Правило продукції 
 

     Правило продукції "якщо А, то В" ("якщо є подія А, тоді є подія В") володіє безперечними перевагами перед  іншими формалізмами, оскільки легко сприймається користувачами, зокрема, лікарями при вирішенні задачі діагностики. Схема міркувань при цьому, в першому наближенні, має вигляд: "якщо спостерігається сукупність ознак А, тоді з великою часткою ймовірності має місце група захворювань В".

     Оскільки  в самому простому вигляді правило  продукції близько за змістом  логічної операції імплікації, для  правила продукції часто застосовують позначення: 

  А®В 

     або, трактуючи А як сукупність деяких заданих умов Pi, i = 1, 2, ... , N,  

P1ÙP2Ù...ÙPn® B, 

     де Ù - символ кон'юнкції.

     Наведемо  приклад правил продукції, застосованих в різних ЕС медичного призначення: 

     ЯКЩО: профіль щільності є "асиметричний гамма-пік"

                  і площа під кривою відповідає  віковій нормі, 

          ТО: концентрація гамаглобуліну  у межах норми.  

     Неважко бачити, що подія А в цьому прикладі є кон'юнкція двох «елементарних» подій, тому цей же приклад можна переписати у вигляді:  

     ЯКЩО: профіль щільності є "асиметричний гамма-пік"

       І 

     ЯКЩО: площа під кривою відповідає віковій  нормі,

         ТО: концентрація гамаглобуліну  у межах норми. 

     Система продукцій зручна для вираження знань, які можуть приймати форму переходів між станами (ситуація ® дію, посилка ® висновок, причина ® слідство).

     Розрізняють продукційні системи, керовані даними (передумовою правил) і продукційні системи, керовані цілями (діями правил).

     База  знань продукційної ЕС складається з безлічі правил продукції (бази правил) і кінцевого набору фактів (бази фактів). [4] 

    1. Моделювання логічних міркувань 
 

     Говорячи  про логічні міркування, можна було б очікувати, що під цим мається на увазі лише процес оперування з «медичною пам'яттю» (вихідними даними для такого оперування являються спостерігаючі симптоми). У цьому сенсі «медична пам'ять» є первинною, а логічні міркування - вторинні. Однак попередньо потрібно зауважити, що питання про «первинність» і «вторинність» на перевірку виявляється досить умовним - «стиль» мислення може мати значний вплив на структуру і характер «медицинської пам'яті».

     Найбільше розповсюдження в медицині та психології отримали так звані табличні алгоритми  ухвалення рішення - алгоритми, що базуються  на обчисленнях з використанням  таблиць виду 1.1-1.2. Підсумовуючи для  спостережуваних ознак числа, наведені у стовпцях цих таблиць, отримують  кілька сум. Діагноз ставлять, орієнтуючись на найбільшу суму.

     Перевагами  табличних алгоритмів є їх виняткова  простота, що дозволяє обходитися без  ЕОМ. Недолік - чутливість до ситуацій, коли деякі ознаки не виміряні з  тих чи інших причин - може виявитися, що ці ознаки як раз є найбільш інформативними.

     В значній мірі вільні від цього  недоліку алгоритми, що використовують імовірнісний підхід до прийняття рішення. Обчислення при цьому здійснюються за формулою Байєса або з використанням методу послідовного статистичного аналізу (методу Вальда). Порівняльна складність обчислень передбачає використання ЕОМ.  

     Таблиця 1.1 – Розподіл вірогідностей захворювань від симптомів

     №№

     пп.п.

 
Симптоми
Геморраг., субархної дальн. Геморраг.,  
в мозок
Геморраг.,      в шлуночок Ішеміч.,  
тромбоз
Ішеміч.,

емболія

     1

1

Сильний головний біль      5      3      0      1      2
     22 Психомоторне  збудження      3      1      0      1      2
     Продовження Таблиці 1.1
     33 Гіперемія обличчя      3      3      2      0      1
     44 Блідність обличчя      0      0      0      3      1
     55 Свідомість  збережено      2      0      –10      3      2
     66 Свідомість  втрачено швидко      0      3      4      1      2
7 Кома      1      2      3      1      0
     88 Артеріал. гіпертонія      2      3      3      1      0
     99 Артеріал. гіпотонія      0      0      0      4      1
     010 Пульс напружений      3      3      3      1      0
     111 Серцева діяльність ослаблена      0      0      0      4      1
     112 Дихання розладж.      0      3      4      0      0
.. ......................... ................ ............. ............... ............. .............
     228 Інфаркт міокарда      0      0      0      10      0
29 Ревмокардит      0      0      0      10      0
30 Вік до 50 років      3      2      1      0      5
     331 Вік більше 50 років      2      3      2      5      0
 

     При обчисленнях за формулою Байєса, як запобіжної достовірності висновку про наявність тієї або іншої патології, використовується умовна ймовірність P (Yj / Xi):

     

                                                                                                (1.4)  
 

     Для безлічі ознак X = (X1 ,..., XI) формула Байєса набуває вигляду:  

                                          (1.5)

                                       

     або, для статистично незалежних ознак,  

     

 (1.6) 
 

     Вирішальне  правило при використанні формули  Байєса полягає у пошуку максимуму функції P (Yj / X1 ,..., XI).

     Зручніше  рекурентний варіант формули  Байєса:  

      ,                    (1.7)  

що дозволяє проводити обчислення в міру оцінювання нових симптомів, не чекаючи моменту, коли будуть оцінені всі I симптомів. Цей принцип дозволяє припинити  облік нових симптомів, якщо лікар  вважатиме оцінку ймовірності аналізованої гіпотези досить високою. Слід лише пам'ятати, що формула (1.7) являє собою варіант формули (1.6), тобто математично коректна лише за умови статистичної незалежності ознак.

     У окремому випадку діагностики одного з двох можливих захворювань і  в припущенні P (Y1) = P (Y2) справедливо співвідношення:  

     

=
, 

     яке для статистично незалежних ознак  можна переписати у вигляді:  

     

=
 

     або, після логарифмування,  

        = = = .               (1.8) 

     У рекурентній формі:  

      = .                                               (1.9)  

     Вирішальне  правило в цьому випадку має  вигляд:  

                                                           ,

                                .                                                        (1.10)  

     У поєднанні з виразом (1.9) це вирішальне правило можна трактувати таким  чином: якщо після врахування чергового  симптому знак величини uI не змінився, є підстави для припинення процесу діагностики. Хоча «для страховки» можна розглянути ще кілька симптомів, переконавшись, що величина uI дійсно продовжує віддалятися від граничного значення 0.

     Недоліком такого роду міркувань є відсутність  міри віддаленості величини uI від значення 0, що можна трактувати як можливість свавілля з боку особи, яка приймає рішення - що одному лікарю здасться достатнім, то іншому - ні.

     Суть  методу послідовного аналізу Вальда полягає в тому, що такий захід вводиться, в результаті чого замість (1.10) використовується вирішальне правило виду:

      

        

,

                                  ,                                             (1.11)

           

, 

де величини a і b, що визначають межі «коридору» в  межах 0, обчислюються виходячи із заданих  значень ймовірностей помилок  e1 і e2 - помилок прийняття рішення про захворювання Y1 при наявності захворювання Y2, і навпаки.

     Крім  того, Вальд строго математично довів доцільність впорядкування діагностичних ознак в порядку зменшення їх інформативності. Втім, теза про необхідність враховувати спочатку більш інформативні ознаки, а потім - менш інформативні, достатньо зрозумілий і на інтуїтивному рівні (з позицій "здорового глузду").

     У практичній діагностиці іноді використовують метод В. С. Генес, сутність якого полягає в тому, що перелік «елементарних» симптомів зводять в один комплексний симптом (синдром) - у цьому випадку обчислення надзвичайно спрощуються, оскільки мова тепер йде про одновимірних щільності розподілів імовірності P (Yj / X) і P (X / Yj). Зауважимо лише, що цей метод застосовується для

діагностики невеликої групи захворювань  в певному лікувальному закладі  в межах чітко вираженого відрізка часу. [5]

     Покажемо  тепер, що «стиль» мислення при прийнятті  рішення дійсно позначається і на формі «медичної пам'яті». Відома, наприклад, діагностична таблиця Сано, що припускає проведення обчислень  за формулою Байєса, з тією лише відмінністю, що завдяки логарифмування операція множення замінюється складанням (табл. 1.2).

     Стосовно  до методу послідовного статистичного  аналізу можна використовувати  «медичну пам'ять», представлену таблицею 1.3.

     При реалізації методу лінійних дискримінантний функцій зручна медична пам'ять, показана в табл. 1.4. Взагалі кажучи, метод лінійних дискримінантний функцій призначений для діагностики двох захворювань, сутність його зводиться до пошуку рівняння площини в багатовимірному просторі ознак. Площина вибирають таким чином, щоб якість рішення задачі діагностики було задовільним у заздалегідь заданому значенні. Один із способів розрахунку дискримінантний коефіцієнтів ai описується співвідношенням:  

     

, 

     де - умовне середнє значення симптому Xi при захворюванні Yj; - сумарна дисперсія симптому Xi при обох захворюваннях. 
 
 
 
 

     Таблиця 1.2 – Діагностична таблиця Сано

Найменування  
признаков
Значення  
признаків
Y1 Y2 . . . Yk
 
X1
x11

x12

x13

. . .

lnP(x11 /Y1)

lnP(x12 /Y1)

lnP(x13 /Y1)

. . .

. . .

. . .

. . .

. . .

. . .

. . .

. . .

. . .

. . .

. . .

. . .

. . .

 
X2
x21

x22

. . .

lnP(x21 /Y1)

lnP(x22 /Y1)

. . .

. . .

. . .

. . .

. . .

. . .

. . .

. . .

. . .

. . .

Xr xr1

. . .

xrm

lnP(xr1 /Y1)

. . .

lnP(xrm /Y1)

. . .

. . .

. . .

. . .

. . .

. . .

. . .

. . .

. . .

   
lnP(Xi/Y1)
     
Аналiз експертних систем, що використовують суб'ектинi ймовiрностi