Нейромережеві технології. Їх відмінність від експертних систем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Реферат на тему:

«Нейромережеві технології. Їх відмінність від експертних систем»

 

 

 

 

 

ЗМІСТ

Вступ…………………………………………………………………………...3

  1. Поняття нейронних мереж та їх особливості………………………...4
  2. Особливості використання нейронних мереж………………………..8
  3. Відмінність нейромережевих техноологій від експертних систем.........................................................................................................................13

Висновок……………………………………………………………………..16

Список використаної літератури…………………………………………...17

 

ВСТУП

Для ефективного управління сучасним підприємством необхідне володіння об’єктивною інформацією. Ще донедавна вважалося, що чим більше маємо інформації про фірму, тим ефективніше можна нею управляти. Однак, це твердження не завжди є справедливим.

Пріоритет у прийнятті рішень належить людині – менеджеру, що володіє стратегічним мисленням і здібностями передбачати появу нових подій. Однак недоліком людського інтелекту є те, що він не пристосований до систематичного виконання великих обсягів обчислень в процесі аналізу складних процесів і систем. Сучасна практика господарювання свідчить, що надмірне нагромадження управлінської інформації досить часто призводить до дезорієнтації менеджерів, які не можуть правильно розпорядитися великими обсягами інформації.

Тому досить актуальною є проблема інтелектуалізації інформаційної системи сучасного підприємства, що дозволить організувати «глибинну» обробку управлінської інформації з використанням сучасних комп’ютерних технологій [6]. Нейромережеві технології і займаються обробкою управлінської інформації і їх використання було б доречним.

 

  1. ПОНЯТТЯ НЕЙРОННИХ МЕРЕЖ ТА ЇХ ОСОБЛИВОСТІ

Розробки в галузі штучного інтелекту1 розпочались з ідеї побудови системи, подібної до нервових клітин людини, що була запропонована Дж. Маккалоком та У. Піттом у 1943 р. та втілена у моделі штучного нейрона і принципах побудови штучних нейронних мереж, що здатні до навчання. Але задача практичного втілення розробленої методики виявилась складною і була розв'язана тільки через 20 років американським нейрофізіологом Ф. Розенблаттом в роботі 1962 р. "Принципи нейродинаміки", де була запропонована модель персептрона2.

Штучна нейронна мережа - паралельно розподілений процесор, який володіє здатністю до навчання, збереження і представлення знань, набутих на основі досвіду.

Нейроподібна мережа - це штучний аналог біологічної мережі, який за своїми параметрами максимально наближається до оригіналу. Нейроподібні мережі пройшли довгий шлях становлення і розвитку, від повного заперечення можливості їх застосування до втілення в багато сфер діяльності людини [4].

Подібність штучної нейронної мережі з мозком полягає в двох аспектах:

  • знання набуваються мережею під час навчання;
  • для збереження знань використовуються міжнейронні з'єднання.

Незважаючи на те, що зв'язок з біологією слабкий і часто суттєвий, штучні нейронні мережі продовжують порівнюватися з мозком. Їх функціонування часто нагадує людське пізнання, тому важко уникнути цієї аналогії. На жаль, такі порівняння неплідні і створюють невиправдані очікування, неминуче ведучі до розчарування. Дослідницький ентузіазм, заснований на помилкових надіях, може випаруватися, зіткнувшись з суворою дійсністю, як це вже одного разу було в шістдесяті роки, і багатообіцяюча область знов прийде в занепад, якщо не буде дотримуватись необхідна стриманість.

Незважаючи на зроблені попередження, корисно все ж знати дещо про нервову систему ссавців, оскільки вона успішно вирішує задачі, до виконання яких лише прагнуть штучні системи.

Нервова система людини, побудована з елементів, званих нейронами, має приголомшуючу складність. Біля 1011 нейронів беруть участь в приблизно 1015 передаючих зв'язках, що мають довжину більше за метр. Кожному нейрону притаманне багато властивостей, загальних з іншими елементами тіла, але його унікальною властивістю є прийом, обробка і передача електрохімічних сигналів по нервових шляхах, що утворюють комунікаційну систему мозку.

Рис. 1.1. Біологічний нейрон

На рис.1.1 показана структура пари типових біологічних нейронів. Дендрити йдуть від тіла нервової клітки до інших нейронів, де вони приймають сигнали в точках з'єднання, званих синапсами. Прийняті синапсом вхідні сигнали надходять до тіла нейрона. Тут вони підсумовуються, причому одні входи прагнуть збудити нейрон, інші перешкодити його збудженню. Коли сумарне збудження в тілі нейрона перевищує деякий поріг, нейрон збуджується, посилаючи по аксону сигнал іншим нейронам. В цій основній функціональній схемі багато узагальнень і винятків, проте більшість штучних нейронних мереж моделюють лише ці прості властивості.

Штучний нейрон імітує в першому наближенні властивості біологічного нейрона. На вхід штучного нейрона поступає деяка множина сигналів, кожний з яких є виходом іншого нейрона. Кожний вхід перемножується з відповідною вагою, аналогічної синаптичній силі, і всі доданки підсумовуються, визначаючи рівень активації нейрона. На рис.1.2 представлена модель, що реалізує цю ідею. Хоча мережеві парадигми досить різноманітні, в основі майже всіх їх лежить ця конфігурація. Тут множина вхідних сигналів, позначених x1, x2,..., xn, надходить на штучний нейрон. Вхідні сигнали, що в сукупності позначені вектором X, відповідають сигналам, що надходять до синапсів біологічного нейрона. Кожний сигнал перемножується з відповідною вагою w1, w2,..., wn, і надходить на підсумовуючий блок, позначений S. Кожна вага відповідає "силі" одного біологічного синаптичного зв'язку. Множина ваг в сукупності позначається вектором W. Підсумовуючий блок, що відповідає тілу біологічного елемента, складає зважені входи алгебраїчно, створюючи вихід, який ми будемо називати NET. У векторних позначеннях це може бути компактно записане таким чином:

NET = XW.

Рис. 1.2. Штучний нейрон

Сигнал NET далі, як правило, перетворюється активаційною функцією F і дає вихідний нейронний сигнал OUT.

На рис.1.3 блок, позначений F, приймає сигнал NET і видає сигнал OUT. Якщо блок F звужує діапазон зміни величини NET так, що при будь-яких значеннях NET значення OUT належать деякому кінцевому інтервалу, то F називається "стискаючою" функцією.

 

Рис.1.3. Штучний нейрон з активаційною функцією

Розглянута проста модель штучного нейрона ігнорує багато які властивості свого біологічного двійника. Наприклад, вона не бере до уваги затримки у часі, які впливають на динаміку системи. Вхідні сигнали відразу ж породжують вихідний сигнал. І, що більш важливо, вона не враховує впливів функції частотної модуляції або синхронізуючої функції біологічного нейрона, які ряд дослідників вважають вирішальними.

Незважаючи на ці обмеження, мережі, побудовані з цих нейронів, виявляють властивості, що сильно нагадують біологічну систему. Тільки час і дослідження зможуть відповісти на питання, чи є подібні збіги випадковими або слідством того, що в моделі вірно схоплені найважливіші межі біологічного нейрона [5].

Перед використанням нейромережі проводиться її навчання, що є ітераційним процесом налаштування вагових коефіцієнтів. Для навчання використовуються спеціальні алгоритми. Найбільше розповсюдження отримали градієнтні методи - алгоритм зворотного поширення похибки (Back Propagation), зв'язаних градієнтів, RProp і інші. Основна особливість нейронних мереж полягає в тому, що в процесі навчання вони моделюють складну нелінійну залежність між вхідними і вихідними даними [3].

 

  1. ОСОБЛИВОСТІ ВИКОРИСТАННЯ НЕЙРОННИХ МЕРЕЖ

Висока «природна» перешкодостійкість і функціональна надійність стосуються як спотворених (зашумлених) потоків інформації, так і в сенсі відмов окремих процесорних елементів. Цим забезпечуються висока оперативність і достовірність обробки інформації, а просте донавчання і перенавчання мереж дозволяють при зміні зовнішніх чинників своєчасно здійснювати перехід на новий рівень вирішуваних завдань.

Наведені вище переваги нейромережевої обробки даних визначають сфери їх застосування:

  • обробка і аналіз зображень;
  • розпізнавання мови незалежно від диктора;
  • обробка високошвидкісних цифрових потоків;
  • автоматизована система швидкого пошуку інформації;
  • класифікація інформації в реальному масштабі часу;
  • планування, застосування сил і засобів у великих масштабах;
  • вирішення трудомістких задач оптимізації;
  • адаптивне управління і передбачення.

В наш час основними напрямами реалізації мереж є:

  • програмна реалізація на цифрових ЕОМ традиційної архітектури;
  • програмно-апаратна реалізація у вигляді співпроцесорів до ЕОМ загального призначення;
  • апаратна реалізація шляхом створення нейрокомп’ютерів на базі нейроплат у вигляді паралельних нейроподібних структур [4].

Нейропакети використовуються і в Україні. В основному - це Brain Maker Professional v.3.11. Є і менш відомі, але професіональніші Neuroforester v.5.1. У цих пакетах генетичний алгоритм управляє процесом спілкування на деякій множині прикладів, а також стабільно розпізнає  нові ситуації з високим ступенем точності навіть в умовах зовнішніх перешкод, наприклад, появи суперечливих або неповних знань. Причому навчання зводиться до роботи алгоритму підбору вагових коефіцієнтів, який реалізується автоматично без безпосередньої участі користувача-аналітика.

Для реалізації нейромережевої технології повинні бути виконані наступні умови: наявність IВМ РС або сумісного комп'ютера, миші, MS Windows 3.1 або вище, 4 Мбайт RАМ (оперативній пам'яті).

На відміну від Brain Maker Professional v.3.11  в пакеті Neuroforester v.5.1. для вирішення прогнозних завдань ряд процедур виконується автоматично. Зокрема, автоматично вибирається оптимальне число днів, що забезпечуються прогнозом. Пакет має також інструменти для попередньої обробки даних: кореляційний аналіз, що дозволяє визначати значущість вхідних параметрів прогнозу; аналіз за допомогою масштабних перетворень і експоненти Херста для виявлень прихованих циклів даних; діаграма-розподіл залежності прогнозованої величини від вхідних параметрів. Ці методи дозволяють вже на етапі підготовки даних виділяти найбільш істотні для прогнозу параметри. Всі результати обробки представляються в графічному вигляді, зручному для аналізу, ухвалення рішень.

При використанні нейромережевої технології робота будується у декілька етапів.

Першим етапом є чітке визначення проблеми, тобто того, що користувач-аналітик збирається отримати від нейромережевої технології на виході. Це може бути деякий вектор, що характеризує систему або процес. Наприклад, крива прибутковості ГКО; ціна відсікання первинного аукціону; показник доцільності реструктуризації інвестиційного портфеля, точки перелому тренда і тому подібне.

Другим етапом є визначення і підготовка початкових даних для реалізації нейромережевої технології. При цьому відбирається вся необхідна інформація, що повно і адекватно описує процес. Для найбільш успішного вирішення проблеми формування наборів інформації та подальшого прогнозування ситуацій рекомендується привертати обізнаних дану конкретну область фахівців.

Складність виконання другого етапу полягає в тому, що повинен бути дотриманий баланс між прагненням збільшити кількість вхідних параметрів і вірогідністю отримати погано навчану мережу, яка може спотворити очікувані прогнози. Річ у тому, що число днів ретроспективи і прогнозу, які залежать від властивостей досліджуваних даних, сильно впливають на точність прогнозу. Тому вибір невідповідного великого числа днів для прогнозу або їх малого числа ретроспективи може привести до того, що мережа буде не в змозі навчатися.

Введення даних в систему, підготовка даних, створення файлів для тренування і тестування можна вважати самостійним третім етапом. Основною метою роботи на цьому етапі є формування необхідного набору ситуацій, з якими доведеться працювати аналітикові, а потім розподіл початкових даних по цих ситуаціях. При цьому нейросетевая технологія автоматично реалізує завдання класифікації, в основі якої лежить нечітка логіка. Як вхідні параметри можуть бути використані штучно створені характеристики системи, зокрема для фондового ринку це можуть бути різні індикатори технічного аналізу.

На етапі підготовки даних аналізується ступінь їх інформаційної насиченості, для чого виявляється ступінь впливу конкретного параметра на прогнозовану величину. Досягнувши рівномірного наповнення всіх ступенів залежності, виявляється відповідність між прогнозованою величиною і параметром у вигляді «Якщо..., то...; інакше...», що близько до реалізації алгоритму нечіткої логіки і експертних систем.

Вибір типу нейромережевої технології і методу її навчання можна виділити в самостійний етап. Мережа може бути побудована за допомогою Net Maker в інтерактивному режимі, користуючись його підказками, або створити файли Brain Maker, користуючись текстовим редактором. Для прогнозування тимчасових рядів, якими описуються фінансові ринки, переважно користуються генетичним алгоритмом Genetik Algorithms, а для вирішення завдань розпізнавання образів і класифікації — мережевими технологіями Hopfield і Kohonen. Найбільш трудомістким процесом є настроювання нейромережі на повчальну вибірку даних, бо тут визначається оптимальна кількість параметрів, властивостей досліджуваних даних, оптимальне число днів ретроспективи і прогнозу. Добре продумані способи завдання тестових множин у поєднанні з декількома варіантами повчальних алгоритмів (від стандартних до швидкісних) і завданням різних критеріїв зупинки навчання надають широкі можливості для експериментів.

Полегшує процес роботи і те, що всі сучасні нейромережеві технології містять ту або іншу систему конвертерів, що дозволяють користуватися даними, підготовленими в популярних початкових форматах. Зокрема, Word System може імпортувати текстові файли, таблиці, підготовлені в Excel, а також дані у форматі Meta Stock. Слід підкреслити Meta Stock не тільки програмний продукт, але і формат ділової іформації, що відрізняється високою компактністю даних у поєднанні з надійністю їх передачі.

Сучасні нейромережеві продукти дозволяють працювати як з числовими, так і з текстовими даними, тобто перетворювати набір символів (слова, фрази) в унікальний набір чисел. Ward System робить можливою також зворотну операцію, тобто представлення результатів роботи нейромережі у вигляді не тільки чисел, але зв'язного тексту, що дозволяє генерувати результати у вигляді різних інформаційних повідомлень. Правила для навчання нейромережі можуть задаватися за допомогою їх введення в готовому вигляді, а також у вигляді чисел, що вимагають додаткових перетворень даних. Причому ці обмежуючі і вирішуючі правила і умови можуть задаватися в процесі рішення задачі. Іншим методом задання правил в Ward System є робота з індикаторами технічного аналізу. Включення індикаторів в процес навчання істотно підвищує не тільки точність прогнозів, але і їх стабільність і статистичну достовірність. Для вирішення цієї ж проблеми в Ward System з більшою ефективністю можна скористатися спеціальним блоком, який містить повний список процедур з можливістю автоматичного підбору параметрів і перенесення вибраних значень в підготовлений набір вхідних даних, що значно полегшує роботу аналітика. Останніми етапами можна вважати проведення тестування нейромережі і її запуск для отримання прогнозу. Працездатність спочатку навчених мереж проводиться на тестовій вибірці даних. За наслідками тестів відбираються найбільш перспективні варіанти. При цьому керуються тим, що точність і надійність прогнозу залежать від типу прогнозованої величини, стану, в якому знаходиться система, типу системи (керована вона ззовні або замкнута). Наприклад, найбільш точний і надійний прогноз локальної зміни тренда в стаціонарному стані ринку.

Якщо результати тестування не задовольняють, то проглядають набір вхідних даних, змінюють деякі навчальні програми або перебудовують мережу. Після завершення повного циклу рішення задачі можливі два шляхи: користуватися в подальшій роботі створеною системою, що цілком прийнятно для одного фахівця, вирішуючи певний круг завдань, або створити для кожного завдання незалежні застосування у вигляді окремого файлу, який може використовуватися іншими програмами.

 

  1. ВІДМІННІСТЬ НЕЙРОМЕРЕЖЕВИХ ТЕХНООЛОГІЙ ВІД ЕКСПЕРТНИХ СИСТЕМ.

Експертна система - це програма, що поводиться подібно експерту в деякій, звичайно вузькій прикладній області.

ЕС створюється за допомогою двох груп людей:

  • інженерів, які розробляють ядро ЕС і, знаючи організацію бази знань, заповнюють її за допомогою:
  • експертів (експерта) за фахом.

Експертні системи можуть виконувати такі функції:

  • інтерпретація даних з метою визначення їх значення;
  • діагноз або визначення стану технічних і біологічних систем на основі інтерпретації даних;
  • контрольні спостереження (моніторингові системи) або неперервна інтерпретація даних у реальному масштабі часу критичних станів об’єктів;
  • прогнозування розвитку майбутнього на основі моделювання теперішнього і минулого;
  • планування і розроблення заходів і дій для досягнення поставлених цілей;
  • проектування або вироблення чітких вказівок щодо побудови об’єктів, які відповідають поставленим вимогам.

Можна виокремити такі класи експертних систем:

  • діагностувальні системи (найвідоміший приклад цього класу — медичні діагностувальні системи);
  • системи моніторингу, коли діагностика та інтерпретація відбуваються в реальному масштабі часу, коли здійснюється сигналізація про вихід параметрів об’єкта стеження за припустимі межі;
  • прогнозувальні системи оцінюють майбутнє на основі моделей минулого і теперішнього часу і здійснюють роботу з гіпотетичними світами майбутнього;
  • планувальні системи забезпечують прийняття рішень щодо оптимального розподілу ресурсів і календарного планування;
  • системи для проектування допомагають не тільки приймати проектні рішення, але й дають змогу виявити мотиви прийняття їх через систему пояснення;
  • системи для управління суміщують у собі системи планування та проектування, а в ланцюгу зворотного зв’язку використовуються діагностувальні та інтерпретувальні системи;
  • системи для навчання близькі до систем для управління, однак можуть бути обернені за своїм функціонуванням; у цьому випадку користувач спочатку здійснює діагностування та інтерпретацію, а потім використовує блоки планування або проектування для впливу на об’єкт управління; далі знову здійснює діагностування та інтерпретацію і використовує інтерпретувальні системи, які близькі до діагностувальних [7].

Експертна система відрізняється від інших прикладних програм наявністю таких ознак:

  • Система, окрім виконання обчислювальних операцій, формує певні висновки, базуючись на тих знаннях, якими вона володіє. Знання в системі, зазвичай, описані деякою спеціалізованою мовою і зберігаються окремо від програмного коду, що формує висновки. Компонент збереження знань прийнято називати базою знань.
  • Під час розв'язання задач основну роль відіграють евристичні і наближені методи, що, на відміну від алгоритмічних, не завжди гарантують успіх. Евристика, в принципі, є правилом впливу (англ. rule of thumb), що в машинному вигляді відображає деяке знання, набуте людиною разом із накопичуванням практичного досвіду розв'язання аналогічних проблем. Такі методи є наближеними в тому сенсі, що, по-перше, вони не потребують вичерпної вихідної інформації, а, по-друге, існує певний ступінь впевненості (або невпевненості) в тому, що запропонований розв'язок є правильним.

Експертні системи відрізняються і від інших видів програм із галузі штучного інтелекту.

  • Експертні системи застосовуються для предметів реального світу, операції з якими зазвичай вимагають великого досвіду, накопиченого людиною. Експертні системи мають яскраво виражену практичну направленість для застосування в науковій або комерційній сфері.
  • Однією з основних характеристик експертної системи є її швидкодія, тобто швидкість отримання результату та його достовірність (надійність). Дослідницькі програми штучного інтелекту можуть бути і не дуже швидкими, натомість, експертна система повинна за прийнятний час знайти розв'язок, що був би не гіршим за розв'язок, що може запропонувати фахівець в цій предметній області.
  • Експертна система повинна мати можливість пояснити, чому запропоновано саме цей розв'язок і довести його обґрунтованість. Користувач повинен отримати всю інформацію, необхідну йому для того, аби переконатись в обґрунтованості запропонованого розв'язку.

Експертні системи представляють собою символьні, а штучні нейронні мережі і генетичні алгоритми — адаптивні методи Штучного інтелекту.

 

ВИСНОВОК

Штучна нейронна мережа - паралельно розподілений процесор, який володіє здатністю до навчання, збереження і представлення знань, набутих на основі досвіду.

Відмінною рисою нейронних мереж є їх здатність міняти свою поведінку (навчатися) залежно від зміни зовнішнього середовища, витягуючи приховані закономірності з потоку даних. При цьому алгоритми навчання не вимагають яких-небудь попередніх знань про взаємозв'язки, що існують в наочній області, — необхідно тільки підібрати достатнє число прикладів, що описують поведінку модельованої системи у минулому. Заснована на нейромережах технологія не пред'являє підвищених вимог до точності вхідних даних як на етапі навчання, так і при її використанні (після настройки і вивчення), наприклад, при розпізнаванні симптомів наближення критичних ситуацій, для короткострокових, а іноді і довгострокових прогнозів. Таким чином, нейромережева технологія володіє двома надзвичайно корисними властивостями.

1. Здатністю навчатися на конкретній  безлічі прикладів.

2. Умінням стабільно розпізнавати прогнозувати нові ситуації з високим ступенем точності, причому в умовах зовнішніх перешкод, наприклад появи суперечливих або неповних значень в потоках інформації.Узявши за основу роботу мозку, нейромережеві технології включили і ряд біологічних термінів, понять, параметрів, а метод отримав назву генетичного алгоритму.

Експертна система - це програма, що поводиться подібно експерту в деякій, звичайно вузькій прикладній області. Типові застосування експертних систем містять у собі такі задачі, як медична діагностика, локалізація несправностей в устаткуванні й інтерпретація результатів вимірів.

Експертні системи представляють собою символьні, а штучні нейронні мережі і генетичні алгоритми — адаптивні методи Штучного інтелекту.

 

СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ

  1. http://uk.wikipedia.org/wiki/%D0%A8%D1%82%D1%83%D1%87%D0%BD%D0%B8%D0%B9_%D1%96%D0%BD%D1%82%D0%B5%D0%BB%D0%B5%D0%BA%D1%82
  2. Лекція: Штучний інтелект. Експертні системи - http://myrefs.org.ua/index.php?view=article&id=847
  3. Інформаційні технології та моделювання бізнес-процесів - Томашевський О.М. - http://pidruchniki.ws/12291025/informatika/neyromerezhevi_tehnologiyi_shtuchnogo_intelektu
  4. OPTICS TODAY «Нейронні мережі, сутність мереж» - http://www.opticstoday.com/katalog-statej/stati-na-ukrainskom/nejromerezhi/nejronni-merezhi-sutnist-merezh.html
  5. Лекція Основи штучних нейронних мереж - http://victoria.lviv.ua/html/wosserman/rozdil1.htm
  6. Печенюк Андрій «Технології штучного інтелекту в управлінні сучасним підприємством» - http://sophus.at.ua/publ/2011_11_15_16_kampodilsk/section_7_2011_11_15_16/tekhnologiji_shtuchnogo_intelektu_v_upravlinni_suchasnim_pidpriemstvom/9-1-0-252
  7. Інформаційний маркетинг - Єжова Л.Ф. - http://studentbooks.com.ua/content/view/789/44/1/4/
  8. Нейронні мережі в медицині http://uk.wikipedia.org/wiki/%D0%9D%D0%B5%D0%B9%D1%80%D0%BE%D0%BD%D0%BD%D1%96_%D0%BC%D0%B5%D1%80%D0%B5%D0%B6%D1%96_%D0%B2_%D0%BC%D0%B5%D0%B4%D0%B8%D1%86%D0%B8%D0%BD%D1%96

 

 

1 «Штучний інтелект» (англ. Artificial intelligence, AI) — розділ комп'ютерної лінгвістики та інформатики, що займається формалізацією проблем та завдань, які нагадують завдання, виконувані людиною.

Ця наука пов'язана з психологією, нейрофізіологією, трансгуманізмом та іншими. Як і всі комп'ютерні науки, вона використовує математичний апарат. Особливе значення для неї мають філософія і робототехніка.

 

2 Персептрон - електронний пристрій для розпізнавання зорових образів.

 

 

 


Нейромережеві технології. Їх відмінність від експертних систем