Ирина Эланс

Автор который поможет с любыми образовательными и учебными заданиями

Обучение линейного нейрона

Федеральное агентство по образованию

Государственное образовательное учреждение

Высшего профессионального образования Тверской Государственный Технический университет

Кафедра «Информационные системы»

Курсовая работа

По дисциплине:

Интеллектуальные информационные системы

На тему:

«Обучение линейного нейрона»

Выполнила студентка: Елисеева А.А.

Гуманитарного факультета

Специальности ПИЭ 0801

Руководитель работы: Козлова Ю.Г.

Тверь, 2010

Содержание

Введение			3
1.	Аналитическая часть
	1.1	Содержательная и математическая постановка решаемой задачи	5
	1.2	Краткое описание возможностей ПС MATLAB 6.1 и тулбокса NNT	12
	1.3	Краткое описание возможностей и особенностей использования приложений Notebook	17
	1.4	Требования к разрабатываемому приложению	22
2.	Практическая часть		24
Заключение			29
Список использованных источников			30

Введение

Идея нейронных сетей родилась в рамках теории искусственного интеллекта, в результате попыток имитировать способность биологических нервных систем обучаться и исправлять ошибки, моделируя низкоуровневую структуру мозга. Структурной единицей, из которой состоит любая нейронная сеть, является нейрон.

Искусственная нейронная сеть – это некоторая математическая абстракция, способная обучаться на примерах и решать неформализованные задачи.

ИНС представляет собой совокупность искусственных нейронов, организованных слоями. При этом выходы нейронов одного слоя соединяются с входами нейронов другого слоя.

Искусственный нейрон имитирует свойства биологического нейрона.

Биологический нейрон состоит из тела диаметром от 3 до 100 мкм, содержащего ядро (с большим количеством ядерных пор) и другие органеллы (в том числе сильно развитый шероховатый ЭПР с активными рибосомами, аппарат Гольджи), и отростков. Выделяют два вида отростков. Аксон — обычно длинный отросток, приспособленный для проведения возбуждения от тела нейрона. Дендриты — как правило, короткие и сильно разветвлённые отростки, служащие главным местом образования влияющих на нейрон возбуждающих и тормозных синапсов (разные нейроны имеют различное соотношение длины аксона и дендритов). Нейрон может иметь несколько дендритов и обычно только один аксон. Один нейрон может иметь связи с 20-ю тысячами других нейронов. Кора головного мозга человека содержит 10—20 миллиардов нейронов.

Математическая модель искусственного нейрона была предложена У. Маккалоком и У. Питтсом вместе с моделью сети, состоящей из этих нейронов. Авторы показали, что сеть на таких элементах может выполнять числовые и логические операции. Практически сеть была реализована Фрэнком Розенблаттом в 1958 году как компьютерная программа, а впоследствии как электронное устройство — персептрон. Первоначально нейрон мог оперировать только с сигналами логического нуля и логической единицы, поскольку был построен на основе биологического прототипа, который может пребывать только в двух состояниях — возбужденном или невозбужденном. Развитие нейронных сетей показало, что для расширения области их применения необходимо, чтобы нейрон мог работать не только с бинарными, но и с непрерывными (аналоговыми) сигналами. Такое обобщение модели нейрона было сделано Уидроу и Хоффом, которые предложили в качестве функции срабатывания нейрона использовать логистическую кривую.

Целью выполнения курсового проекта является расширение теоретических и закрепление практических знаний, полученных в ходе аудиторных и самостоятельных занятий.

Для достижения поставленной цели необходимо решить следующие задачи:

самостоятельное изучение специальной литературы
изучение встроенных инструментальных средств системы для математических расчетов MATLAB
рассмотрение возможностей и особенностей базового программного обеспечения из состава ППП Neural Network Toolbox (NNT) ПС MATLAB 6
практическое применение ППП Neural Network Toolbox (NNT) ПС MATLAB 6 при проектировании вероятностной нейронной сети

Аналитическая часть

1.1. Содержательная и математическая постановка решаемой задачи

Нейрон состоит из нескольких частей:

S – сома;

x1, x2, x3,…,xn – дендриты (вход);

y – аксон (выход);

На вход искусственного нейрона поступает некоторое множество сигналов, каждый из которых является выходом другого нейрона.

Точка соединения аксона первого нейрона с дендритом другого нейрона называется синапс. Каждый дендрит имеет некоторый вес (W1, W2…), который называется синаптическим весом.

Текущее состояние нейрона определяется как взвешенная сумма его входов:

Эта сумма получила название потенциал нейрона. Потенциал нейрона сравнивается с некоторой заданной пороговой величиной W0.

Если , то нейрон не срабатывает.

В противном случае вычисляется функция активации

y = f(S).

Функция активации f может быть различных видов.

Линейная функция

Сигнал на выходе нейрона линейно связан со взвешенной суммой сигналов на его входе.

f(x) = tx, где t - параметр функции.

В искусственных нейронных сетях со слоистой структурой нейроны с передаточными функциями такого типа, как правило, составляют входной слой. Кроме простой линейной функции могут быть использованы её модификации. Например, полулинейная функция (если её аргумент меньше нуля, то она равна нулю, а в остальных случаях, ведет себя как линейная) или шаговая (линейная функция с насыщением), которую можно выразить формулой:

При этом возможен сдвиг функции по обеим осям (как изображено на рисунке).

Недостатками шаговой и полулинейной активационных функций относительно линейной можно назвать то, что они не являются дифференцируемыми на всей числовой оси, а, значит, не могут быть использованы при обучении по некоторым алгоритмам.

Пороговая функция

Другое название - Функция Хевисайда. Представляет собой перепад. До тех пор пока взвешенный сигнал на входе нейрона не достигает некоторого уровня T — сигнал на выходе равен нулю. Как только сигнал на входе нейрона превышает указанный уровень — выходной сигнал скачкообразно изменяется на единицу. Самый первый представитель слоистых искусственных нейронных сетей — персептрон состоял исключительно из нейронов такого типа. Математическая запись этой функции выглядит так:

Здесь T = − w0x0 — сдвиг функции активации относительно горизонтальной оси, соответственно под x следует понимать взвешенную сумму сигналов на входах нейрона без учёта этого слагаемого. Ввиду того, что данная функция не является дифференцируемой на всей оси абсцисс, её нельзя использовать в сетях, обучающихся по алгоритму обратного распространения ошибки и другим алгоритмам, требующим дифференцируемости передаточной функции.

Сигмоидная функция

Один из самых часто используемых, на данный момент, типов передаточных функций. Введение функций сигмоидного типа было обусловлено ограниченностью нейронных сетей с пороговой функцией активации нейронов — при такой функции активации любой из выходов сети равен либо нулю, либо единице, что ограничивает использование сетей не в задачах классификации. Использование сигмоидных функций позволило перейти от бинарных выходов нейрона к аналоговым. Функции передачи такого типа, как правило, присущи нейронам, находящимся во внутренних слоях нейронной сети.

Линейная сеть – это один слой из S нейронов и R входов, каждый

из которых может состоять из нескольких элементов. Передаточной

функцией каждого нейронного слоя является линейная функция purelin.

Это является единственным отличием линейной сети от персептрона.

Благодаря линейной передаточной функции каждый выход сети может принимать любое значение, в то время как выход персептрона ограничен значениями 1 и 0.

Линейные сети, как и персептроны, способны решать только линейно отделимые задачи классификации, однако в них используется правило обучения по методу Вудроу–Хоффа, основанное на использовании функции наименьших квадратов, которое является более мощным, чем правило обучения персептрона.

Помимо основных входов нейроны линейной сети имеют вход для постоянного смещения, равного единице. Элементы входов и смещения взвешиваются с помощью функции скалярного произведения dotprod и суммируются с помощью функции накопления netsum.

Линейная нейронная сеть может быть создана одним из следующих способов:

net=newlin(PR, S, id, lr),

net=newlin(PR, S, 0, P),

net=newlind(P, T),

где PR – массив размера R*2 минимальных и максимальных значений для R векторов входа;

S – число нейронов;

id – описание линии задержки на входе сети, по умолчанию [0];

lr – параметр скорости настройки, по умолчанию 0,01;

P – обучающие последовательности входов размера R*Q, причем

Q – количество последовательностей;

Т – последовательность целей для Р размера S*Q;

0 – нуль.

Первый способ применяется, когда в сеть включаются задержки, т. е. для создания динамических адаптивных линейных нейронных сетей ADALIN (ADApture Linear Neuron networks), которые позволяют корректировать веса и смещения при поступлении на вход каждого элемента обучающего множества. Такие сети широко применяются при решении задач обработки сигналов и в системах управления.

Второй способ формирует линейный слой с параметром скорости настройки, гарантирующим максимальную степень устойчивости для данного входа Р. В этом случае линии задержки не используются, и сеть является статической.

Для первого и второго способа инициализация сети проводится при ее создании с помощью функции initzero. Адаптация и обучение сети затем осуществляется с помощью функции adaptwb, которая модифицирует веса и смещения, используя функцию Видроу – Хоффа hearnwh до тех пор, пока не будет достигнуто требуемое значение критерия качества обучения в виде средней квадратичной ошибки, вычисляемой функцией mse.

Третий способ формирует и настраивает линейную статическую сеть, решая систему линейных алгебраических уравнений на основе метода наименьших квадратов. Он используется для подбора коэффициентов аппроксимирующей функции и для идентификации параметров динамических систем в задачах управления. Матричная запись решаемой системы линейных алгебраических уравнений такова:

[W b]*[P;ones]=T,

при этом должно выполняться условие

S*R + S = Q.

Функция learnwh вычисляет приращение весов входов и смещений по следующим векторным формулам:

pn = p/(sqrt(1+P(1)^2)+… +P(R)^2);

dW = lr*e*pn;

db = lr*e.

При работе с моделями линейных сетей могут возникнуть ситуации, когда число настраиваемых параметров недостаточно, чтобы выполнить все условия; в этом случае сеть считается переопределенной. Если число параметров слишком велико, сеть считается недоопределенной. И в том и в другом случае метод наименьших квадратов осуществляет настройку, стремясь минимизировать ошибку сети.

Архитектура однослойной линейной сети полностью определяется задачей, которая должна быть решена, причем число входов сети и число нейронов в слое определяются числом входов и выходов задачи соответственно.

1.2. Краткое описание возможностей ПС MATLAB 6.1 и тулбокса NNT.

Возможности ранних версий MATLAB

Уже первые, ориентированные на Microsoft Windows, версии системы (MATLAB 4.x) обладали мощными средствами выполнения научно-технических вычислений и их визуализации. В их числе задание и применение обычных векторов и матриц, разреженных матриц, многомерных массивов, массивов ячеек и структур. Уже системы MATLAB 5.* обладали обширными возможностями в визуализации результатов вычислений и имели десятки пакетов расширения.

Возможности версий MATLAB 6.0/6.1

Версия системы MATLAB 6.0 не только позволяет заменить предшествующие

версии, но и характеризуется целым рядом новых и важных возможностей:

• доведенное до более чем 600 число встроенных функций и команд;

• новый интерфейс с набором инструментов для управления средой, вклю-

чающий в себя окно команд (Command Window), окно истории команд

(Command History), браузер рабочей области (Workspace Browser) и редактор

массивов (Array Editor);

• новые инструменты, позволяющие при помощи мыши интерактивно ре-

дактировать и форматировать графики, оптимизировать их коды и затраты

памяти на графические команды и атрибуты;

• улучшенные алгоритмы на основе оптимизированной библиотеки

LAPACK;

• новая библиотека FFTW (быстрых преобразований Фурье) Массачусетско-

го технологического института;

• ускоренные методы интегральных преобразований;

• новые, более мощные и точные алгоритмы интегрирования дифференци-

альных уравнений и квадратур;

• новые современные функции визуализации: вывод на экран двумерных изо-

бражений, поверхностей и объемных фигур в виде прозрачных объектов;

• новая инструментальная панель Camera для управления перспективой и ус-

корение вывода графики с помощью OpenGL;

• новый интерфейс для вызова Java-процедур и использования Java-объектов

непосредственно из MATLAB;

• новые, современные инструменты проектирования графического пользова-

тельского интерфейса;

• обработка (регрессия, интерполяция, аппроксимация и вычисление основ-

ных статистических параметров) графических данных прямо из окна гра-

фики;

• новое приложение MATLAB для системы разработки Visual Studio, позво-

ляющее автоматически, непосредственно из Microsoft Visual Studio, преобра-

зовывать Си и Си++ коды в выполняемые MATLAB файлы (МЕХ-файлы);

• интеграция с системами контроля версий кода, такими как Visual Source

Safe;

• новый интерфейс (последовательный порт) для обмена данными с внеш-

ним оборудованием из MATLAB;

• новый пакет управления измерительными приборами (Instrument Control

ToolBox) для обмена информацией с приборами, подключенными к Каналу

общего пользования (GPIB, HP-IB, 1EEE-488) или к шине VXI через адап-

тер VXI — GPIB (только в версиях для Windows и Sun Solaris) и последова-

тельному интерфейсу RS-232, RS-422, RS-485 (также и для Linux-версии), в

том числе в соответствии со стандартом VISA (Virtual Instruments Systems

Application — Применение виртуальных измерительных приборов);

• существенно обновленные пакеты расширения, в частности, новые версии

пакета моделирования динамических систем Simulink 4 и Real Time

Workshop 4;

• интеграция с системами управления потребностями, например, DOORS.

Поставляемый с системой MATLAB 6.0 новый пакет расширения Simulink 4

также имеет ряд новинок. Они перечислены ниже по категориям.

Усовершенствование пользовательского интерфейса:

• новый графический отладчик для интерактивного поиска и диагностики

ошибок в модели;

• усовершенствован навигатор моделей (Model Browser, Windows 95/98/Me/

2000/NT4);

• новый однооконный режим для открытия подсистем;

• контекстное меню для блок-диаграмм (открывается щелчком правой кноп-

ки мыши) как в Windows, так и в Unix версиях;

• новый диалог Finder для поиска моделей и библиотек.

Все это говорит о том, что двенадцатый выпуск системы (MATLAB 6.0 + Simulink 4.0 + Stateflow 4.0 +...) подвергся не косметической, а самой серьезной переработке, выдвигающей эту систему на новый уровень развития и применения. Вышедшая вслед за MATLAB 6.0 версия MATLAB 6.1 претерпела несущественные изменения. В нее, в частности, добавлены всего три новые функции — одна по обработке строк и две по реализации звуковых возможностей. Однако существенно обновился набор пакетов расширения этой системы. Тем не менее считать MATLAB 6.1 новой реализацией нельзя и не случайно MathWorks объявила MATLAB 6.1 лишь модификацией MATLAB 6.0.

Neural Network Toolbox обеспечивает всестороннюю поддержку проектирования, обучения и моделирования множества известных сетевых парадигм, от базовых моделей персептрона до самых современных ассоциативных и самоорганизующихся сетей. Пакет может быть использован для исследования и применения нейронных сетей к таким задачам, как обработка сигналов, нелинейное управление и финансовое моделирование.

NNTool позволяет создавать следующие сети:

№ п/п	Тип сети	Название сети	Число слоев	Обучаемые параметры
1	Competitive	Конкурирующая сеть	1	IW{1, 1}, b{ 1}
2	Cascade-forward backprop	Каскадная сеть с прямым распространением сигнала и обратным распространением ошибки	2	IW{1, 1}, b{1} LW{2, 1} IW{2, 1}, b{2}
3	Elman backprop	Сеть Элмана с обратным распространением ошибки	2	IW{1, 1}, b{1} LW{2, 1}, b{2} LW{2, 1},
4	Feed-forward backprop	Сеть с прямым распространением сигнала и обратным распространением ошибки	2	IW{1, 1}, b{1} LW{2, 1}, b{2}
5	Time delay backprop	Сеть с запаздыванием и обратным распространением ошибки	2	IW{1, 1}, b{1}, LW{2, l},b{2}
6	Generalized regression	Обобщенная регрессионная сеть	2	IW{1, 1}, b{1}, LW{2, l}
7	Hopfield	Сеть Хопфилда	1	LW{l, l},b{l}
8	Linear layer (design)	Линейный слой (создание)	1	IW{1, 1}, b{1}
9	Linear layer (train)	Линейный слой (обучение)	1	IW{1, 1}, b{1}
10	LVQ	Сеть для классификации входных векторов	2	IW{1, 1}, LW{2, 1}
11	Perceptron	Персептрон	1	IW{1, 1), b{l}
12	Probabalistic	Вероятностная сеть	2	IW{1, 1}, b{l}, LW{2, 1}
13	Radial basis (exact fit)	Радиальная базисная сеть с нулевой ошибкой	2	IW{ 1, 1}, b{ 1}, LW{2, 1}
14	Radial basis (fewer neurons)	Радиальная базисная сеть с минимальным числом нейронов	2	IW{1, 1}, b{ 1}, LW{2, 1}, b{2}
15	Self-organizing map	Самоорганизующаяся карта Кохонена	1	IW{1, 1}

1.3. Краткое описание возможностей и особенностей использования приложений Notebook

Открытие нового документа класса Notebook

Для создания своего Notebook откройте меню Файл текстового процессора при загруженном в него файле readme. Вы обнаружите в этом меню новую команду New M-book (Создание новой М-книги). Выполнив ее, вы увидите пустое окно, в котором можно вводить обычный текст. При этом правила ввода текста полностью совпадают с таковыми для текстового процессора Word. В частности, вы можете задавать любые стили и выделения в текстовой части создаваемого

Notebook.

Иногда из-за неточностей в установке файловой структуры такой способ не дает положительного результата. На этот случай в каталоге NOTEBOOK предусмотрено два пустых файла шаблонов: M-book.dot (для Word 97 и более поздних версий) и Mbook95.dot (для Word 95). Загрузив эти файлы, можно установить Word для подготовки документа в виде Notebook, причем окно документа будет пустым и готовым для задания нового документа в формате шаблона.

Ячейки ввода MATLAB в тексте Word

Ячейки ввода MATLAB можно ввести прямо в текст документа. Для этого текст ячейки ввода набирается в Word как обычный текст. Затем он выделяется (с помощью мыши или клавиш перемещения по горизонтали при нажатой клавише Shift) и фиксируется нажатием клавиш Ctrl + Enter или исполнением команды

Evaluate Cell из меню Notebook.

Преобразование текстов Word в ячейки ввода

Иногда желательно создать Notebook из самого обычного файла редактора Word. Для этого надо создать новый Notebook и загрузить нужный файл, используя команду Файл (File) меню Вставка (Insert). В созданный таким образом шаблон Notebook можно добавить ячейки ввода MATLAB.

Математические формулы в Notebook

В документы Notebook можно вводить математические формулы любого вида.

Для этого достаточно воспользоваться встроенным в Word редактором математических формул. Наряду с файлом readme.doc в новых версиях MATLAB обычно поставляется файл sigprog.doc, содержащий документ с описанием свертки матриц для обработки сигналов.

Сохранение документов класса Notebook

Созданный Notebook записывается так же, как любой другой документ Word.

Если нужно сохранение Notebook с заданным именем, то надо исполнить команду Save As (Сохранить как) из меню File (Файл) главного меню. Появится стандартное окно записи файла (рис. 2.12), и его можно записать как файл документа с расширением .doc.

Если использовался шаблон, то это будет окно шаблона. В этом случае файл записывается с расширением .dot. При закрытии последнего из ряда документов приложение Notebook создает окно с запросом о том, нужно ли закрыть MATLAB. Для редактирования уже созданного Notebook достаточно загрузить его с помощью команды Открыть из меню Файл.

Создание ячейки ввода

Команда Define Input Cell (Alt + D) формирует ячейку ввода. Если маркер ввода

находится в начале абзаца, то весь абзац преобразуется в ячейку ввода. Если команда используется при наличии выделенного фрагмента текста, то этот фрагмент преобразуется в ячейку ввода. Ячейка автостарта (см. ниже) также преобразуется в ячейку ввода, если в ней размещен маркер ввода. Пустая строка с маркером ввода становится ячейкой ввода после набора нужного выражения и его фиксации нажатием клавиш Ctrl + Enter. Текст ячейки ввода обрамляется жирными квадратными скобками — [Текст]. Используется стиль Input с жирным шрифтом Courier New темно-зеленого цвета размером 10 пунктов.

Создание ячейки автостарта

Команда Define Autolnit Cell создает ячейку автостарта. Это ячейка, которая будет исполняться сразу после загрузки М-книги в текстовый процессор Word. Тут уместно отметить, что обычные ячейки (без автостарта) не эволюционируют без специальной команды. Ячейки автостарта обязательно эволюционируют и выдают результаты, соответствующие имеющимся в М-книге входным данным. Правила применения этой команды те же, что были описаны для предшествующей команды. Текст соответствующей ячейки стиля Autolnit имеет темно-синий

цвет (шрифт Courier New, размер 10 пунктов).

Создание зоны вычислений

Команда Define Calc Zone превращает выделенный текст (с ячейками ввода и вывода) в некоторую зону вычислений, решающую определенную задачу. Таких зон в М-книге может быть много, и они могут использоваться для решения ряда задач. Примером, где такие зоны полезны, являются сборники различных задач с действующими примерами.

Преобразование ячеек MATLAB в обычный текст

Команда Undefine Cells преобразует выделенные ячейки в обычный текст. Обрамления ячеек при этом убираются, а текст представляется стилем Обычный (Normal). Если выделений текста нет, а маркер ввода стоит на ячейке MATLAB, то именно эта ячейка преобразуется в текст.

Удаление ячеек вывода

Команда Purge Output Cell удаляет ячейки вывода. Если надо удалить одну ячейку вывода, достаточно разместить в ней маркер ввода и исполнить данную команду. Для удаления нескольких ячеек их надо предварительно выделить. При этом можно выделить и весь текст М-книги, содержащей ячейки вывода.

Создание многострочной ячейки ввода

Команда Group Gells объединяет все ячейки ввода в выделенной части документа в группу ячеек ввода. При этом выделенный текст размещается после этой группы, за исключением той части текста, которая размещена до первой ячейки. Ячейки вывода, имеющиеся в выделенном тексте, устраняются. Если первая ячейка ввода имеет статус ячейки автостарта, то такой статус приобретают все ячейки группы. Группе ячеек можно придать этот статус и с помощью команды Autolnit Cell.

Преобразование группы ячеек в ячейки ввода

Команда Ungroup Cells преобразует группу ячеек в обычные ячейки ввода или ячейки автостарта. Ячейки вывода, связанные с преобразуемыми ячейками, удаляются. Для преобразования надо указать группу путем размещения маркера ввода в конце строки, завершающей группу, или в ячейке вывода, связанной с выделенной группой ячеек.

Управление показом маркеров

Как уже указывалось, обычно ячейки ввода и вывода MATLAB отмечаются жирными серыми квадратными скобками (маркерами), отличными от обычных квадратных скобок. Маркеры видны только на экране дисплея. Команда Hide/Show Cell Markers позволяет убрать или, напротив, включить показ маркеров. При печати М-книг маркеры не печатаются независимо от того, видны они на экране дисплея или нет.

Пуск оценки ячеек

Команда Evaluate Cell (Оценка Ячейки) направляет текущую ячейку ввода или группу ячеек в решатель MATLAB для проведения необходимых вычислений или обработки данных. Этот процесс принято называть оцениванием (evaluate) или попросту вычислением ячейки. Результат, в том числе и в виде сообщений об ошибках (они выводятся красным цветом), направляется в ячейку вывода текстового редактора Word. Ячейка ввода (или группа ячеек) считается текущей, если маркер ввода находится в ее поле, в конце ее строки или в связанной с ней ячейке вывода. Выделенная ячейка также считается текущей.

Пуск оценки зоны

Команда Evaluate Calc Zone (Оценка вычисляемой зоны) вызывает пересчет текущей зоны вычислений. Зона считается текущей, если в ней размещен маркер ввода. Для каждой ячейки ввода в зоне создается ячейка вывода.

Пуск оценки всей М-книги

Команда Evaluate M-book вызывает пересчет всех ячеек ввода или групп ячеек для текущей М-книги. Текущей является та книга, текст которой (или его часть) виден в активном окне текстового процессора Word. Заметим, что Word может работать с несколькими М-книгами поочередно. При этом все они загружены в свои окна, но лишь одно окно (видимое на экране) является активным и текущим. Вычисления начинаются от начала М-книги и продолжаются до ее конца. Результаты вычислений поступают в ячейки вывода, а если каких-либо выходных ячеек еще нет, то они создаются. Рекомендуется применять эту команду в конце отладки и редактирования М-книги, чтобы соблюсти соответствие между модифицированными ячейками ввода и их ячейками вывода.

1.4. Требования к разрабатываемому приложению

Доступность - требования ко времени непрерывной работы приложения, например, 24x7, минимальное время простоя и т.п.;

Обучение линейного нейрона 📙 Курсовая → 🆔 146117