Нужна помощь в написании работы?

Нейронные сети — универсальные аппроксимирующие устройства и могут с любой точностью имитировать любой непрерывный автомат. Доказана обобщённая аппроксимационная теорема: с помощью линейных операций и каскадного соединения можно из произвольного нелинейного элемента получить устройство, вычисляющее любую непрерывную функцию с любой наперёд заданной точностью. Это означает, что нелинейная характеристика нейрона может быть произвольной: от сигмоидальной до произвольного волнового пакета или вейвлета, синуса или многочлена. От выбора нелинейной функции может зависеть сложность конкретной сети, но с любой нелинейностью сеть остаётся универсальным аппроксиматором и при правильном выборе структуры может сколь угодно точно аппроксимировать функционирование любого непрерывного автомата

Нейросетевое прогнозирование

В последнее время при прогнозировании все больше внимания уделяется нетрадиционным методам. Это связано с появлением новых способов обработки информации. Среди них в первую очередь надо отметить нейронные сети, генетические алгоритмы и пр. Отличительная черта этих методов заключается в отсутствии жестких предпосылок их применения и возможности использования в условиях нестабильных экономических ситуаций .

Перспективным направлением прогнозирования в индустрии гостеприимства выступает применение нейронных сетей.

Нейронные сети – это набор нейронов, определенным образом связанных между собой. Основные принципы строения и функционирования биологических нейронов следующие :

1. Основную роль в деятельности нервной системы играют специальные клетки – нейроны (рис. 1.2), связанные между собой нервными волокнами. Нейроны могут посылать друг другу электрические импульсы – сигналы различной силы и частоты.

Рис. 1.2. Биологический нейрон

2. Нейрон состоит из дендритов (по ним принимаются сигналы от других нейронов), тела нейрона (они обеспечивает жизнедеятельность всей клетки) и аксона (это длинная нить, по ней нейрон может передавать сигналы другим нейронам). Аксон контактирует с дендритами других нейронов посредством специальных образований – синапсов, которые влияют на силу сигнала. Таким образом, синапсы можно считать входами нейрона.

3. Сигналы, полученные нейроном от нескольких других нейронов одновременно, суммируются. Если сила суммарного сигнала превышает некоторое пороговое значение (важна также длительность сигнала), то нейрон возбуждается, генерирует собственный импульс и передает его по аксону.Чтобы построить математическую модель (рис. 1.3), необходимо принять несколько предположений:

1. Каждый нейрон обладает передаточной функцией (рис. 1.4), определяющей условия его возбуждения в зависимости от силы полученных сигналов. Передаточные функции не зависят от времени.

2. При прохождении синапса сигнал меняется линейно, т.е. сила сигнала умножается на некоторое число, которое называется весом синапса или весом соответствующего входа нейрона.

3. Деятельность нейронов синхронизирована, т.е. время прохождения сигнала от нейрона к нейрону фиксировано и одинаково для всех связей. То же самое относится ко времени обработки принятых сигналов.

Рис. 1.3. Математический нейрон

Внимание!
Если вам нужна помощь в написании работы, то рекомендуем обратиться к профессионалам. Более 70 000 авторов готовы помочь вам прямо сейчас. Бесплатные корректировки и доработки. Узнайте стоимость своей работы.

Веса синапсов могут меняться со временем – это принципиальная особенность. Именно изменение этих весов отвечает за возможность различной реакции организма на одни и те же условия в разные моменты времени, т.е. возможность обучения.

Искусственные нейросети обладают определенными биологическими чертами, такими, как параллельность обработки информации в нейронах и адаптивность. Утверждение, что нейросеть – это черный ящик – отражает важный недостаток нейросетевого подхода – сложную интерпретируемость результатов. Ответ сети – нелинейная функция от входных значений, и поэтому непросто понять, какими особенностями входного примера обусловлена реакция сети. Однако в некоторых практических задачах интерпретация не столько важна, как сам результат.

Нейросети способны к самообучению, хотя пользователю необходимо грамотно готовить данные, выбирать тип сети, подстраивать различные параметры и учиться интерпретировать результаты.

 

Рис. 1.4. Работа нейрона

В настоящее время нейросетевая технология становится обычным инструментом обработки данных, достаточно сложный в освоении и использовании, но эффективной для определенного класса задач. Список этих задач постоянно растет.

Основные этапы решения задач традиционными статистическими и продвинутыми нейросетевыми методами представлены на рис. 1.5 и 1.6.

Статистические гипотезы?

  • однородность выборки;
  • независимость переменных;
  • функция распределения;
  • уровень значимости.

Какая зависимость ?

  • нелинейность;
  • оценка параметров.

Остаточная ошибка?

Информативность переменных?

Рис. 1.5. Традиционный статистический подход

Какая конфигурация сети?

  • сколько слоев;
  • сколько нейронов;
  • функции активации;
  • сколько входов.

Алгоритм обучения?

  • число примеров;
  • качество обучения.

Достоверность решений?

Информативность сенсоров?

Рис. 1.6. Нейросетевой подход

Улучшенные методы моделирования, например, адаптивные модели экспоненциального сглаживания, дают не больше интерпретируемой информации, чем нейронные сети.

Преимущества нейросетевых технологий таковы:

1) возможность решения практически любой задачи;

2) задачи могут быть плохо формализованы, иметь зашумленные и неверные входные данные;

3) отсутствие всяких требований к форме распределения данных;

4) возможность комбинирования сетей;

5) сочетание способности компьютера к обработке чисел и способности мозга к обобщению и распознаванию.

Существует большое количество сетей . К основным видам относятся:

1. Многослойный персептрон. В настоящее время сети многослойного персептрона (MLP) являются самыми широко используемыми. В них применяются линейная пост-синаптическая функция и нелинейная функция активации. Количество слоев и нейронов в каждом слое – неограничено. Применение в выходном слое MLP линейной функции активации позволяет проводить экстраполяцию данных, т. е. строить прогнозы. Сеть MLP можно обучать многими методами. Самым известным является метод обратного распространения, разработка которого свершила прорыв в технологии нейронных сетей. К сожалению, обратное распространение – самый медленный метод, застревающий в локальных минимумах, требующий установки множества параметров обучения.

2. Сети радиальной базисной функции. Сеть радиальной базисной функции (RBF) имеет только один скрытый слой, в котором используются радиальные элементы. Обучение происходит в три этапа: размещение центров, определение отклонений и линейная оптимизация выходного слоя. Сеть RBF обучается быстро, не проявляет склонности к необоснованной экстраполяции.

3. Сети Кохонена. Пожалуй, самый оригинальный вид сети. Они не имеют четко выраженного выходного слоя. Данные со входного слоя подаются на так называемую карту Кохонена, которая представляет собой, как правило, двумерную матрицу нейронов . Эта сеть использует неконтролируемое обучение, что позволяет: искать зависимости в новых данных (т. е. тех, у которых не известен заранее результирующий показатель) – проводить разведочный анализ данных; классифицировать данные без классификатора; решать задачу близости классов.

4. Линейные сети имеют два слоя – входной и выходной, обучаются мгновенно.

5. Байесовские сети. Вид сети, используемый только для классификации.

6. Регрессионные сети обучаются довольно быстро, но имеют большой размер.

7. Большой набор сетей, применимых только в отдельных задачах, но все-таки являющихся определенным этапом в процессе развития нейросетевых технологий: Adaline, Boltzmann, Brain-State-In-a-State, изучение категорий, Hopfield, Madaline, Perceptron, SPR.

Обучение сетей – один из главных этапов разработки нейросетевой модели. Существует большое количество методов обучения: обратное распространение; спуск по сопряженным градиентам, метод Levenberg-Marquardt, быстрое распространение, Delta-Bar-Delta, алгоритм Кохонена, обучение RBF (несколько способов для каждого из трех шагов), методы обучения вероятностных, регрессионных сетей. Применение того или иного вида обучения связано в первую очередь с видом используемой сети, а кроме того, и с удобством использования. Некоторые алгоритмы обучения требуют установки множества параметров и процедура обучения сети может затянуться надолго. Современные методы обучения, как например, сопряженные градиенты, обеспечивают быстрое обучение без утомительной настройки.

Реализация нейросетевых технологий имеет два основных вида: программную и аппаратную. Аппаратная реализация требует специального рассмотрения и в пособии не изложена. Перед пользователем программной реализации нейронных сетей первой становится задача выбора способа их использования . Сравнительные преимущества и недостатки каждого из видов представлены в табл. 1.3.

Таблица 1.3

Секторы рынка нейросетевых программных продуктов*

Сегмент рынка

Преимущества продукции

Недостатки продукции

Нейропакеты общего назначения

Не требуют самостоятельного программирования, легко осваиваются, инструмент быстрого и дешевого решения прикладных задач

Не способны к расширению и генерированию отчуждаемых приложений, не могут использоваться для разработки сложных систем или их подсистем

Системы разработки нейроприложений

Могут использоваться для создания сложных систем обработки данных в реальном времени (или их подсистем)

Требуют навыков программирования, более глубокого знания нейросетей

Готовые решения на основе нейросетей

Не предполагают знакомства пользователя с нейросетями, предоставляют комплексное решение проблемы

Как правило – дорогое удовольствие

Нейро-консалтинг

Не предполагает участия пользователя в получении прогнозов, потенциальная дешевизна услуг

Нет возможности дополнить предсказания своим know how. Доступность к конфиденциальной информации

 

* Ежов А.А., Шумский С.А. Нейрокомпьютинг и его применения в экономике и бизнесе. МИФИ. М., 1998.

Программная реализация нейронных сетей претерпевает в настоящее время бум. Большинство компаний – производителей программного обеспечения по статистической обработке и анализу данных (не говоря уже о Data Mining) – имеет в своем арсенале и пакет нейросетевого моделирования.

Назовем основные: STATISTICA Neural Networks (StatSoft – http://www.statsoft.ru), SPSS Neural Connection (SPSS – http://www.spss.com, http://www.spss.ru), SAS Enterprise Miner (SAS Institute – http://www.sas.com), NeuroShell, NeuroWindows (Ward Systems Group), NeuroBuilder и, конечно, BrainMaker. Список далеко не полон. На WEB-страницах, указанных в списке информационных ресурсов Интернет, можно найти более полный.

Кластеризация с помощью нейронных сетей и поиск зависимостей

Помимо задач классификации, нейронные сети широко используются для поиска зависимостей в данных и кластеризации.

Нейронные сети - полином

Например, нейронная сеть на основе методики МГУА (метод группового учета аргументов) позволяет на основе обучающей выборки построить зависимость одного параметра от других в виде полинома. Такая нейронная сеть может не только мгновенно выучить таблицу умножения, но и найти сложные скрытые зависимости в данных (например, финансовых), которые не обнаруживаются стандартными статистическими методами.

Нейронные сети - кластеры

Кластеризация - это разбиение набора примеров на несколько компактных областей (кластеров), причем число кластеров заранее неизвестно. Кластеризация позволяет представить неоднородные данные в более наглядном виде и использовать далее для исследования каждого кластера различные методы. Например, таким образом можно быстро выявить фальсифицированные страховые случаи или недобросовестные предприятия.

Применение нейронных сетей в задачах прогнозирования

Задачи прогнозирования особенно важны для практики, в частности, для финансовых приложений, поэтому поясним способы применения нейронных сетей в этой области более подробно.

    Рассмотрим практическую задачу, ответ в которой неочевиден - задачу прогнозирования курса акций на 1 день вперед.
    Пусть у нас имеется база данных, содержащая значения курса за последние 300 дней. Простейший вариант в данном случае - попытаться построить прогноз завтрашней цены на основе курсов за последние несколько дней. Понятно, что прогнозирующая нейронная сеть должна иметь всего один выход и столько входов, сколько предыдущих значений мы хотим использовать для прогноза - например, 4 последних значения. Составить обучающий пример очень просто - входными значениями нейронной сети будут курсы за 4 последовательных дня, а желаемым выходом нейронной сети - известный нам курс в следующий день за этими четырьмя.

    Если нейронная сеть совместима с какой-либо системой обработки электронных таблиц (например, Excel), то подготовка обучающей выборки состоит из следующих операций:

  1. Скопировать столбец данных значений котировок в 4 соседних столбца.
  2. Сдвинуть второй столбец на 1 ячейку вверх, третий столбец - на 2 ячейки вверх и т.д.

Нейронные сети - подготовка данных

    Смысл этой подготовки легко увидеть на рисунке - теперь каждая строка таблицы представляет собой обучающий пример, где первые 4 числа - входные значения нейронные сети, а пятое число - желаемое значение выхода нейронной сети. Исключение составляют последние 4 строки, где данных недостаточно - эти строки не учитываются при тренировке нейронной сети. Заметим, что в четвертой снизу строке заданы все 4 входных значения, но неизвестно значение выхода нейронной сети. Именно к этой строке мы применим обученную нейронную сеть и получим прогноз на следующий день.

Как видно из этого примера, объем обучающей выборки зависит от выбранного нами количества входов нейронной сети. Если сделать 299 входов, то такая нейронная сеть потенциально могла бы строить лучший прогноз, чем нейронная сеть с 4 входами, однако в этом случае мы имеем всего 1 обучающий пример, и обучение бессмысленно. При выборе числа входов нейронной сети следует учитывать это, выбирая разумный компромисс между глубиной предсказания (число входов нейронной сети) и качеством обучения нейронной сети (объем тренировочного набора).

 

Получить выполненную работу или консультацию специалиста по вашему учебному проекту
Узнать стоимость
Поделись с друзьями