|
||||||||||||
|
||||||||||||
|
|||||||||
МЕНЮ
|
БОЛЬШАЯ ЛЕНИНГРАДСКАЯ БИБЛИОТЕКА - РЕФЕРАТЫ - Нейроподобный элемент нейронНейроподобный элемент нейрон1. Нейроподобный элемент (нейрон) . На нейроподобный элемент поступает набор входных сигналов x1, x2,...,
xM (или входной вектор X) , представляющий собой выходные сигналы других
нейроподобных элементов. Каждый входной сигнал умножается на
соответствующий вес связи w1, w2,..., wM - аналог эффективности синапса. [pic] (1.3) или сигмоидная Нейроподобная сеть представляет собой совокупность нейроподобных
элементов, определенным образом соединенных друг с другом и с внешней
средой. Входной вектор (координирующий входное воздействие или образ
внешней среды) подается на сеть путем активации входных нейроподобных
элементов. Множество выходных сигналов нейронов сети y1, y2,..., yN
называют вектором выходной активности, или паттерном активности нейронной
сети. Веса связей нейронов сети удобно представлять в виде матрицы W, где w
ij - вес связи между i- и j-м нейронами. В процессе функционирования Рассматриваемые нами модели нейронных сетей объединены в три группы. Прямой персептрон. В середине 50-х годов была предложена одна из первых моделей нейронных сетей, которая вызвала большой интерес из-за своей способности обучаться распознаванию простых образов. Эта модель - персептрон - состоит из бинарных нейроподобных элементов и имеет простую топологию, что позволило достаточно полно проанализировать ее работу и создать многочисленные физические реализации. Типичный персептрон состоит из трех основных компонент: 1. матрицы бинарных входов r1, r2,..., rn (сенсорных нейронов или “сетчатки” , куда подаются входные образы) ; 2. набора бинарных нейроподобных элементов x1, x2,..., xm (или предикатов в наиболее общем случае) с фиксированными связями к подмножествам сетчатки (“детекторы признаков” ) ; 3. бинарного нейроподобного элемента с модифицируемыми связями к этим предикатам (“решающий элемент” ) . Таким образом, модель персептрона характеризуется наличием только
прямых связей, один из слоев которых является модифицируемым. В постейшем
случае, когда n = m и xi = ri, детекторы признаков могут рассматриваться
как входной слой. Тогда персептрон становится одним бинарным нейроподобным
элементом. Это классическая модель М-входового нейрона, приведенная на рис. Устройство реагирует на входной вектор генерацией выходного сигнала y решающего элемента по формуле (1.3) . Таким образом, персептрон формирует гиперплоскость, которая делит многомерное пространство x1, x2,..., xm на две части и определяет, в какой из них находится входной образ, выполняя таким образом, его классификацию. Возникает вопрос, как определить значения весов, чтобы обеспечить решение персептроном конкретной задачи. Это достигается в процессе обучения. Один из алгоритмов обучения приведен в параграфе 2.2. Многослойный персептрон. Как отмечалось выше, простой персептрон с
одним слоем обучаемых связей формирует границы областей решений в виде
гиперплоскотей. Двухслойный персептрон может выполнять может выполнять
операцию логического “И” над полупространствами, образованными
гиперплоскостями первого слоя весов. Это позволяет формировать любые,
возможно неограниченные, выпуклые области в пространстве входных сигналов. Ансамблевые нейронные сети. Минский и Пейперт отмечали, что недостатки простых персептронов можно преодолеть как с помощью многослойных сетей (см. выше) , так и введением в сеть обратных связей, допускающих циркуляцию сигналов по замкнутым контурам. Использовать свойства такого рода сетей для моделирования функций мозга еще в 1949 г. предложил Хебб. Согласно взглядам Хебба нервные клетки мозга соединены друг с другом
большим количеством прямых и обратных возбуждающих связей и образуют
нейронную сеть. Каждый нейрон осуществляет пространственно-временную
суммацию приходящих к нему сигналов от возбуждающих, определяя потенциал на
своей мембране. Когда потенциал на мембране превышает пороговое значение,
нейрон возбуждается. Нейрон обладает рефрактерностью и усталостью. Идеи Хебба оказали большое воздействие на представления о работе
мозга и послужили основой для создания нейронных моделей долговременной
памяти. Действительно, ансамблевую нейронную сеть можно рассматривать как
структуру, реализующую функции распределенной ассоциативной памяти. Модель памяти на основе ансамблевой нейронной сети обладает
некоторыми свойствами, присущими биологической памяти, таким, как
ассоциативность, распределенность, параллельность, устойчивость к шуму и
сбоям, надежность. Проводятся также структурные аналоги между ансамблевыми
моделями нейронных сетей и строением коры головного мозга. Имеются
экспериментальные данные о синаптической пластичности, постулированной Модель ансамблиевой сети состоит из большого количества нейронов,
каждый из которых обычно соединен со всеми другими элементами сети. Входной
образ подается на сеть путем активации нужных нейроподобных элементов. Сеть Хопфилда. Хотя многочисленные результаты моделирования
демонстрировали стабильность ансамблевых сетей с обратными связями и
хеббовским правилом обучения (эволюцию сети к устойчивому состоянию) ,
отсутствие математического обоснавания такого поведения препятствовало их
популярности. [pic], (2.1)
где pi - вероятность нахождения i-го блока в единичном состоянии; P (x) -
сигмоидная функция (рис. 1.2. б) ; T - параметр, аналогичный температуре. Карты признаков Кохонена. Обычно в качестве входных образов в моделях
ассоциативной памяти используются некоторые внутренние представления
сенсорной информации, прошедшей, как считается, необходимую предобработку. Структура нейронной сети, в которой реализуется формирование карт
признаков, приведена на рис. 2.1. Нейроны, имеющие сигмоидную
характеристику, расположены в виде одно- и двумерного слоя слоя по аналогии
со слоистым строением коры. На каждый нейрон поступают два вида связей:
mij, которые интерпретируются как связи от сенсорных входов или из других
областей, и w jk - латеральные связи от нейронов одного слоя, характер
которых зависит от расстояния между нейронами. Функция взаимодействия
нейронов одного слоя имеет вид “мексиканской шляпы” (рис. 2.2.) , что
соответствует некоторым нейробиологическим данным. Близко расположенные
нейроны возбуждают друг друга, с увеличением расстояния возбуждение
сменяется торможением, а затем опять появляются слабые возбуждающие связи,
которые по-видимому, выполняют ассоциативные функции и в данной модели не
используются. Входные сигналы полностью определяют процесс самоорганизации сети, т.е. в ней реализован алгоритм обучения без учителя. Латеральные связи w jk в модели считаются постоянными, и все адаптивные эффекты происходят только в матрице входных связей М. Подробнее процесс обучения рассмотрен в параграфе 2.2. Теория адаптивного резонанса. Пожалуй, одна из самых развитых и продуманных с биологической точки зрения концепций нейросетевой обработки информации предложена в работах Гроссберга. Ее стержнем является модель нейронной сети и алгоритмы теории адаптивного резонанса, которая была разработана в начале 70-х годов и детализирована в 80-х. Нейронная система теории адаптивного резонанса способна обучаться
распознаванию образов различной степени сложности. Она относит входной
образ к одному из классов в зависимости от того, на какой образ из
запомненных образов он больше всего похож. Если входной образ не
соответствует ни одному из запомненных, создается новый класс путем его
запоминания. Если найден образ, с определенным “допуском” соответствующий
входному, то он модифицируется так, чтобы стать еще больше похожим на
входной. Одно из важнейших свойств нейроподобной сети - способность к
самоорганизации, самоадаптации с целью улучшения качества функционирования. [pic] (1.5) где w ij(t) и w ij(t+1) - значение связи
от i-го к j-му нейрону соответственно до и после его изменения, a -
скорость обучения. В настоящее время существует множество разнообразных
обучающих правил (алгоритмов обучения) . Некоторые из них приведены ниже. Этот алгоритм является обобщением одной из процедур обучения простого персептрона, известной как правило Уидроу - Хоффа (или дельта-правило) , и требует представления обучающей выборки. Выборка состоит из набора пар образов, между которыми надо установить соответствие, и может рассматриваться как обширное задание векторной функции, область определения которой - набор входных образов, а множество значений - набор выходов. Перед началом обучения связям присваиваются небольшие случайные значения. Каждая итерация процедуры состоит из двух фаз. Во время первой фазы на сеть подается входной вектор (образ) путем установки в нужное состояние входных элементов. Затем входные сигналы распространяются по сети, порождая некоторый выходной вектор. Для работы алгоритма требуется, чтобы характеристика вход - выход нейроподобных элементов была неубывающей и имела ограниченную производную. Обычно для этого используют сигмоидную нелинейность вида (1.4) . Полученный выходной вектор сравнивается с требуемым. Если они
совпадают, обучения не происходит. В противном случае вычисляется разница
между фактическими и требуемыми выходными значениями, которая передается
последовательно от выходного слоя к входному. На основании этой информации
об ошибке производится модификация связей с обобщенным дельта-правилом. Обучение без “воспитателя” возможно например в сетях адаптивного
резонанса (параграф 2.1.3.) . Происходит сравнение входного образа с
имеющимися в памяти сети шаблонами. Если нет подходящего шаблона, с которым
можно было бы отождествить исследуемый образ, то создается новый шаблон,
содержащий в себе этот входной образ. В дальнейшем новый шаблон
используется наравне с другими. Термин “нейрокомпьютер” употребляется для обозначения всего спектра работ в рамках подхода к построению систем искусственного интеллекта, основанного на моделировании элементов, структур, взаимодействий и функций различных нервной системы. Так как в настоящее время исследования в этой области ведутся в основном на уровне моделей нейронных сетей, то понимание термина “нейрокомпьютеры” сужают, ставя знак равенства между ним и нейронными сетями. В зависимости от способа реализации моделей нейронных сетей выделяют Специфичность нейросетевых операций, а также сверхпараллельность
структуры и функционирования моделей нейронных сетей чрезвычайно замедляют
их реализацию на обычных последовательных компьютерах. Потребность в
выполнении большого объема исследовательских работ и быстром
функционировании появившихся прикладных систем привели к появлению
специализированных вычислительных устройств для эффективного моделирования
нейронных сетей - нейрокомпьютеров в узком смысле слова. Такая трактовка,
соответствующая уровням 2 и 3 по приведенной классификации, получила
широкое распространение. Рассмотренные нами нейроподобные сети могут выполнять большой круг задач. |
РЕКЛАМА
|
|||||||||||||||||
|
БОЛЬШАЯ ЛЕНИНГРАДСКАЯ БИБЛИОТЕКА | ||
© 2010 |