Представление знаний в базах знаний

     Содержание:

Введение………………………………………………………………………..…3

Глава 1. Понятие знаний и баз знаний ..….……………………………………..5

Глава 2. Модели представления знаний ………………………………………..9

Глава 3 Проблема представления знаний ………………………………..……19

Заключение………………………………………………………………………21

Список литературы………………………………………………………………22 
 
 
 
 
 

 

     

     Введение.

    Наступивший XXI век станет этапным для проникновения  новых информационных технологий и  создаваемых на их основе высокопроизводительных компьютерных систем во все сферы  человеческой деятельности - управление, производство, науку, образование и  т.д. Конструируемые посредством этих технологий интеллектуальные компьютерные системы призваны усилить мыслительные способности человека, помочь ему  находить эффективные решения так  называемых плохо формализованных  и слабоструктурированных задач, характеризующихся  наличием различного типа неопределенностей  и огромными поисковыми пространствами. Сложность таких задач усиливается  зачастую необходимостью их решения  в очень ограниченных временных  рамках, например, при управлении сложными техническими объектами в аномальных режимах или при оперативном  разрешении конфликтных (кризисных) ситуаций. Наибольшей эффективности современные  интеллектуальные системы достигают  при реализации их как интегрируемых  систем, объединяющих различные модели и методы представления и оперирования знаниями, а также механизмы приобретения (извлечения) знаний из различных источников.

    Понятие «управление знаниями» родилось в середине 1990-х годов в крупных  корпорациях, где проблемы обработки  информации приобрели критический  характер. Постепенно пришло понимание  того, что знания -- это фундаментальный ресурс, базирующийся на практическом опыте специалистов и на данных, существующих на конкретном предприятии. Компании, которые осознали ценность «знания» и наладили управление им, способны лучше использовать свои традиционные ресурсы, комбинировать их особыми способами, обеспечивая большую выгоду для потребителей, чем конкуренты.

    Знания  неявно стали одним из главных  источников капитала. Однако применяются  эти знания не столько в производственных, сколько в управленческих процессах, предполагающих принятие стратегических и оперативных решений.

    Прежде, чем рассуждать о представлении  знаний в доступном и «понятном» машине виде, требуется определиться с терминологией. Это в достаточной  степени проблематично, так как  такие термины, как «информация», «данные» и «знания» не имеют четкого  определения, а то множество определений, что были созданы человечеством, иногда не просто частично пересекаются, а даже противоречат одно другому.

    Данные - факты и идеи, представленные в некотором, четко формализованном виде, в котором их можно использовать для передачи в информационном процессе. Сведения, представленные в определенной знаковой системе и на определенном материальном носителе для обеспечения возможностей хранения, передачи, приема и обработки.

    Информация  - данные, определенным образом организованные, имеющие для своего получателя смысл, значение и ценность, необходимые для принятия решений, а также реализации других функций. Данные, сопровождающиеся смысловой нагрузкой, помещенные в некоторый контекст; данные, как-либо оцениваемые получателем информации. При этом то, что для одних является данными, для других может оказаться информацией.

    Знания  -проверенная информация и та информация, которой доверяют, результаты принятия решений, поведения, обобщенные в виде теорем и законов, совокупности взглядов. Зафиксированная и проверенная практикой информация, котороя может многократно использоваться людьми для решения тех или иных задач.

    То, что мы знаем - ограничено, а что не знаем - бесконечно. Апулей.

 

     

     Глава 1. Понятие знаний и баз знаний.

    Знания  в общеупотребительном смысле –  это, с одной стороны, сведения, осведомленность  в какой-либо области, с другой стороны  – проверенный практикой результат  познания действительности, ее «правильное» отражение в сознании человека. В  соответствии с концепцией баз знаний, под термином знания в искусственном интеллекте понимают совокупность специализированных (ориентированных на решение многих задач из ограниченной предметной области) фактов, правил их обработки, условий применения правил к конкретным фактам, методов получения новых фактов и способов организации процесса логического вывода.

    Знания  отличаются от данных рядом существенных свойств:

  • единицей обрабатываемой информации является факт, а не запись данных;
  • знания обладают внутренней интерпретируемостью – понимание смысла, семантики информационных единиц обеспечивается внутри модели, а не только в сознании исследователя;
  • знания обладают активностью – появление новых фактов в системе приводит к инициации процедур, обрабатывающих уже известные системе факты, т. е. данные управляют программой;
  • знания обладают связностью – между фактами и правилами имеется возможность установления функциональных, каузальных, структурных, семантических отношений, отношений эквивалентности (подобия, тождества), противоположности и др.;
  • знания обладают структурированностью. Структурированность знаний проявляется при использовании отношений типа «элемент-класс» и «часть-целое» , что позволяет реализовать возможность вложения одних понятий в другие;
  • знания обладают семантической метрикой – отношение близости понятий, силы ассоциативной связи между ними. Ее наличие позволяет выделять информацию, относящуюся к типовым ситуациям, например, «выход из строя элемента системы», «блокировка пакетов» и т.п.;
  • знания обладают конвертируемостью представления. Конвертируемость представления – свойство изменять форму представления, уровень детализации и степень неопределенности информации о предметной области в процессе перехода к очередному этапу решения интеллектуальной задачи. Это свойство, в отличие от предыдущих, отражает динамичность знаний и связано с обучением системы.

    Формально под фактом подразумевается запись:

    

  • – имя или идентификатор факта;
  • – значение факта, определяемое на численной шкале с метрикой, логической, нечеткой или лингвистической шкалах;
  • – степень уверенности (от англ. certitude) в истинности значения;
  • – множество связей факта с другими знаниями;
  • – множество допустимых функций преобразований, операций, способов вычисления значения факта, имеющих смысл в рассматриваемой предметной области.

    Другими словами, факт – это запись данных, наделенная семантикой.

    Правилами в общем случае являются знания вида:

    «Если X есть A, то Y есть B, иначе Y есть C»

    Примером  правила с четырьмя посылками  и одним заключением может  служить следующее высказывание, определяющее выбор версии СУБД:

    ЕСЛИ 
  колво_проц => 1 
  и 
  тактовая_частота_проц => 600 
  и 
  объем_НМЖД => 30 
  и 
  объем_ОП => 1024 
ТО 
  версия_oracle = 8.0

    Условия применимости правил, а также знания относительно способов использования  фактов и правил относятся к метазнаниям (знаниям о знаниях), которые необходимы для управления логическим выводом, пополнения знаний и т.п. Часто такие  правила и способы являются эвристическими.

    В общем виде система семантической  обработки информации, основанная на концепции баз знаний, включает:

  • базу знаний, состоящую из базы фактов и правил как декларативной части, а также базы процедур и функций как процедурной части описания предметной области;
  • механизм логического вывода – высокоуровневый интерпретатор, обеспечивающий обработку фактов на основе правил и процедур формирования решений для задач пользователя;
  • интерфейс с пользователем на языке, близком к естественному;
  • базу целей, содержащую механизм целеполагания в рамках исследуемой предметной области и целевые установки самой системы.

    В перспективе возможно дополнение системы  другими элементами, например базой  ресурсов, базой интуиции и т.п.

    Концепция баз знаний, являясь логическим развитием  монопольно-файловых систем и систем, основанных на концепции баз данных, создает предпосылки для расширения возможностей отображения закономерностей предметной области и получения новых знаний путем их вывода (манипулирования знаниями). При этом значительно ослабляется противоречие между «мягким», нечетко очерченным миром реальности и требованиями по «жесткому», формализованному представлению информации в ЭВМ.

    Большинство исследователей искусственного интеллекта рассматривают задачу разработки моделей представления знаний как задачу программной реализации концепции баз знаний. Это означает, что модели представления знаний должны обладать всеми свойствами, присущими знаниям.

 

 

     

Глава 2. Модели представления знаний.

    Модели  представления знаний – это одно из важнейших направлений исследований в области искусственного интеллекта. Почему одно из важнейших? Да потому, что без знаний искусственный интеллект не может существовать в принципе. Действительно, представьте себе человека, который абсолютно ничего не знает. Например, он не знает даже таких элементарных вещей как:

  • для того, чтобы не умереть от голода, необходимо периодически есть;
  • необязательно из одного края города в другой идти пешком, если для этих целей можно воспользоваться общественным транспортом.

    Таких примеров удастся привести еще много, но уже сейчас можно легко ответить на следующий вопрос: «Поведение такого человека может считаться разумным?». Конечно же, нет. Именно поэтому, при  создании систем искусственного интеллекта особенное внимание уделяется моделям  представления знаний.

    На  сегодняшний день разработано уже  достаточное количество моделей. Каждая из них обладает своими плюсами и  минусами, и поэтому для каждой конкретной задачи необходимо выбрать  именно свою модель. От этого будет зависит не столько эффективность выполнения поставленной задачи, сколько возможность ее решения вообще.

    Отметим, что модели представления знаний относятся к прагматическому  направлению исследований в области  искусственного интеллекта. Это направление  основано на предположении о том, что мыслительная деятельность человека – «черный ящик». При таком  подходе не ставится вопрос об адекватности используемых в компьютере моделей  представления знаний тем моделям, которыми пользуется в аналогичных  ситуациях человек, а рассматривается лишь конечный результат решения конкретных задач.

    Рассмотрим  три наиболее часто используемые и популярные на сегодняшний день модели представления знаний:

  1. продукционные модели – модели основанные на правилах, позволяют представить знание в виде предложений типа: «ЕСЛИ условие, ТО действие». Продукционные модели обладает тем недостатком, что при накоплении достаточно большого числа правил, они начинают противоречить друг другу;
  2. сетевые модели или семантические сети – как правило, это граф, отображающий смысл целостного образа. Узлы графа соответствуют понятиям и объектам, а дуги – отношениям между объектами;
  3. фреймовые модели – основывается на таком понятии как фрейм (англ. frame – рамка, каркас). Фрейм – структура данных для представления некоторого концептуального объекта. Информация, относящаяся к фрейму, содержится в составляющих его слотах. Слоты могут быть терминальными либо являться сами фреймами, т.о. образуя целую иерархическую сеть.

Продукционная модель знаний.

    Продукционные модели можно считать наиболее распространенными  моделями представления знаний. Продукционная модель – это модель, основанная на правилах, позволяющих представить знание в виде предложений типа:

    «ЕСЛИ условие, ТО действие»

    Продукционная модель обладает тем недостатком, что  при накоплении достаточно большого числа (порядка нескольких сотен) продукций  они начинают противоречить друг другу.

    В общем случае продукционную модель можно представить в следующем  виде:

    

  • – имя продукции;
  • – сфера применения продукции;
  • – условие применимости продукции;
  • – ядро продукции;
  • – постусловия продукции, актуализирующиеся при положительной реализации продукции;
  • – комментарий, неформальное пояснение (обоснование) продукции, время введения в базу знаний и т. д.;

    Системы обработки знаний, использующие продукционную  модель получили название «продукционных систем». В состав экспертных систем продукционного типа входят база правил (знаний), рабочая память и интерпретатор правил (решатель), реализующий определенный механизм логического вывода. Любое продукционное правило, содержащееся в базе знаний, состоит из двух частей: антецендента и консеквента. Антецедент представляет собой посылку правила (условную часть) и состоит из элементарных предложений, соединенных логическими связками «и», «или». Консеквент (заключение) включает одно или несколько предложений, которые выражают либо некоторый факт, либо указание на определенное действие, подлежащее исполнению. Продукционные правила принято записывать в виде антецедент-консеквент.

    Примеры продукционных правил:

    ЕСЛИ 
  «двигатель не заводится» 
  и 
  «стартер двигателя не работает» 
ТО  
  «неполадки в системе электропитания стартера»

    Любое правило состоит из одной или  нескольких пар «атрибут-значение». В рабочей памяти систем, основанных на продукционных моделях, хранятся пары атрибут-значение, истинность которых установлена в процессе решения конкретной задачи к некоторому текущему моменту времени. Содержимое рабочей памяти изменяется в процессе решения задачи. Это происходит по мере срабатывания правил. Правило срабатывает, если при сопоставлении фактов, содержащихся в рабочей памяти, с антецедентом анализируемого правила имеет место совпадение, при этом заключение сработавшего правила заносится в рабочую память. Поэтому в процессе логического вывода объём фактов в рабочей памяти, как правило, увеличивается (уменьшаться он может в том случае, если действие какого-нибудь правила состоит в удалении фактов из рабочей памяти). В процессе логического вывода каждое правило из базы правил может сработать только один раз.

    Существуют  два типа продукционных систем –  с «прямыми» и «обратными» выводами. Прямые выводы реализуют стратегию «от фактов к заключениям». При обратных выводах выдвигаются гипотезы вероятностных заключений, которые могут быть подтверждены или опровергнуты на основании фактов, поступающих в рабочую память. Существуют также системы с двунаправленными выводами.

    Основные  достоинства систем, основанных на продукционных моделях, связаны  с простотой представления знаний и организации логического вывода. К недостаткам таких систем можно  отнести следующее:

  • отличие от структур знаний, свойственных человеку;
  • неясность взаимных отношений правил;
  • сложность оценки целостного образа знаний;
  • низкая эффективность обработки знаний.

    При разработке небольших систем (десятки  правил) проявляются в основном положительные  стороны продукционных моделей  знаний, однако при увеличении объёма знаний более заметными становятся слабые стороны.

    Семантические сети или сетевые  модели знаний.

    Однозначное определение семантической сети в настоящее время отсутствует. В инженерии знаний под ней  подразумевается граф, отображающий смысл целостного образа. Узлы графа  соответствуют понятиям и объектам, а дуги – отношениям между объектами. Формально сеть можно задать в  следующем виде:

    

  • – множество информационных единиц;
  • – множество типов связей между информационными единицами;
  • – отображение, задающее конкретные отношения из имеющихся типов между элементами .

    Семантическая сеть как модель наиболее часто используется для представления декларативных  знаний. С помощью этой модели реализуются  такие свойства системы знаний, как  интерпретируемость и связность, в  том числе по отношениям и . За счет этих свойств семантическая сеть позволяет снизить объем хранимых данных, обеспечивает вывод умозаключений по ассоциативным связям.

    Одной из первых известных моделей, основанных на семантической сети, является TLC-модель (Teachaple Languge Compre-hender – доступный механизм понимания языка), разработанная Куиллианом в 1968 году. Модель использовалась для представления семантических отношений между концептами (словами) с целью описания структуры долговременной памяти человека в психологии.

    Как правило, различают экстенсиональные и интенсиональные семантические сети. Экстенсиональная семантическая сеть описывает конкретные отношения данной ситуации. Интенсиональная – имена классов объектов, а не индивидуальные имена объектов. Связи в интенсиональной сети отражают те отношения, которые всегда присущи объектам данного класса.

    Примером  семантической сети может служить  фрагмент описания вычислительной техники, показанный на рисунке.

    

    С помощью такой сети, используя  отношение  и , можно вывести факты: «Багет-11» – это ЭВМ; IBM PC имеет процессор и т.д. Для отображения процедурных знаний используются процедурные семантические сети. В этом случае факты, отношения и процедуры представлены как вершины, а связи объединяют их в единое понятие.

Фреймовая модель знаний.

    Фреймовая модель основана на концепции Марвина Мински (Marvin Minsky) – профессора Массачусетского технологического института, основателя лаборатории искусственного интеллекта, автора ряда фундаментальных работ. Фреймовая модель представляет собой систематизированную психологическую модель памяти человека и его сознания.

    Фрейм (англ. frame – рамка, каркас) – структура данных для представления некоторого концептуального объекта. Информация, относящаяся к фрейму, содержится в составляющих его слотах.

    Слот (англ. slot – щель, прорезь) может быть терминальным (листом иерархии) или представлять собой фрейм нижнего уровня.

    Каждый  фрейм, как показано на рисунке ниже, состоит из произвольного числа  слотов, причем несколько из них обычно определяются самой системой для выполнения специфических функций, а остальные определяются пользователем.

    

    Пояснение:

  • имя фрейма (имя фрейма) – это идентификатор, присваиваемый фрейму. Фрейм должен иметь имя, единственное в данной фреймовой модели (уникальное имя);
  • имя слота(имя слота) – это идентификатор, присваиваемый слоту. Слот должен иметь уникальное имя во фрейме, к которому он принадлежит. Обычно имя слота не несет никакой смысловой нагрузки и является лишь идентификатором данного слота, но в некоторых случаях оно может иметь специфический смысл;
  • указатель наследования – только для фреймовых моделей иерархического типа; они показывают, какую информацию об атрибутах слотов во фрейме верхнего уровня наследуют слоты с такими же именами во фрейме нижнего уровня;
  • указатель атрибутов – указатель типа данных слота. К таким типам относятся: (указатель), (целое), (вещественное), (булево), (присоединенная процедура), (текст), (список), (таблица), (выражение) и другие;
  • значение слота – значение, соответствующее типу данных слота и удовлетворяющее условиям наследования;
  • демон – процедура, автоматически запускаемая при выполнении некоторого условия. Демоны запускаются при обращении к конкретному слоту фреймовой модели. Например, демон запускается, если в момент обращения к слоту его значение не было установлено, запускается при подстановке в слот значения, запускается при стирании значения слота.
 
 
 
 
 
 

    Пример  фреймовой модели иерархического типа представлен на рисунке ниже:

    

    Фреймы  образуют иерархию. Иерархия во фреймовых  моделях порождает единую многоуровневую структуру, описывающую либо объект, если слоты описывают только свойства объекта, либо ситуацию или процесс, если отдельные слоты являются именами  процедур, присоединенных к фрейму и вызываемых при его актуализации.

    Формально фрейм – это тип данных вида:

    

  • – имя объекта;
  • – множество слотов, содержащих факты, определяющие декларативную семантику фрейма;
  • – множество слотов, обеспечивающих связи с другими фреймами (каузальные, семантические и т. д.);
  • – множество слотов, обеспечивающих преобразования, определяющие процедурную семантику фрейма.

    Фреймы  подразделяются на:

  • фрейм-экземпляр – конкретная реализация фрейма, описывающая текущее состояние в предметной области;
  • фрейм-образец – шаблон для описания объектов или допустимых ситуаций предметной области;
  • фрейм-класс – фрейм верхнего уровня для представления совокупности фреймов образцов.

    Состав  фреймов и слотов в каждой конкретной фреймовой модели может быть разный, однако в рамках одной системы  целесообразно единое представление  для устранения лишнего усложнения.

    Разнотипные объекты или объекты, соответствующие  концепции «множественности миров», заключающейся, к примеру, в том, что лошадь – животное бескрылое  для одного (реального) мира и одновременно крылатое (Пегас в мифическом мире) для другого, могут описываться  отличающимися друг от друга фреймами.

    В целом фреймовая модель допускает  представление всех свойств декларативных  и процедурных знаний. Глубина  вложенности слотов во фрейме (число  уровней) зависит от предметной области  и языка, реализующего модель.

 

    

Глава 3. Проблема представления знаний.

    Система искусственного интеллекта – это  система, оперирующая знаниями о  проблемной области. Без базы знаний систем искусственного интеллекта не существует. Для формализации и представления  знаний разрабатываются специальные  модели представления знаний и языки  для описания знаний, выделяются различные  типы знаний.

    Модели  представления знаний относятся  к прагматическому направлению (основано на предположении о том, что мыслительная деятельность человека – «черный  ящик») в исследованиях по искусственному интеллекту. При этом в системах, основанных на знаниях, информационные структуры представляются в форме  декларативных (описательных) знаний, а алгоритмы и эвристики –  в форме процедурных знаний.

    Признано, что системы, основанные на знаниях, целесообразно разрабатывать с  выделением ряда подсистем. Основными  из них считаются:

  • подсистема представления декларативных знаний;
  • подсистема представления процедурных знаний;
  • подсистема манипулирования знаниями (механизм логического вывода).

    Целью такого разделения является возможность  использования системы в различных  предметных областях. Для этого достаточно заменить подсистему представления  декларативных знаний без изменения  остальных частей. В самом деле, имея универсальный механизм логического  вывода, достаточно заполнить оболочку системы конкретными правилами  и фактами из требуемой предметной области, чтобы получить готовую  к применению систему.

    История развития методов инженерии знаний свидетельствует о том, что эта  идея продолжительное время являлась основополагающим направлением исследований. Так, например, А. Ньюэлл и Г. Саймон из Университета Карнеги-Меллона (США) разработали программу GPS – универсальный решатель задач. В формальной логике был разработан метод резолюций. В 70-х гг. XX в., однако, большинство исследователей пришли к выводу, что не существует универсальной системы представления процедурных знаний, пригодной для всех областей деятельности. Подтверждением этому служит высокая ценность специалистов-экспертов в узких предметных областях. Была сформулирована проблема представления знаний.

    Проблема  представления знаний заключается  в несоответствии между сведениями о зависимостях данной предметной области, имеющимися у специалиста, методами, используемыми им при решении  задач, и возможностями формального (однозначно-ограниченного) представления  такой информации в ЭВМ. Часто  проблема осложняется трудностями  для эксперта по формулированию в  явном виде имеющихся у него знаний.

Представление знаний в базах знаний