<<
>>

Основные характеристики, типология и принципы построения искусственных нейронных сетей при прогнозировании финансовых рынков

Искусственные нейронные сети обладают рядом важных характеристик, которые могут быть задействованы при построении моделей, имитирующих механизм принятия решений, на финансовых рынках. Выделим некоторые из них, которые могут быть особенно полезны с точки зрения прогнозирования финансовых рядов (подробнее см.

[19]):

1) Распределённость. Распределённые системы имеют определённое преимущество по сравнению с иерархическими в качестве, скорости обработки информации, безопасности её хранения, а
также общей устойчивости. В качестве примеров можно привести распределённые электрические сети, сеть Интернет, а также уже упоминавшиеся выше природные сообщества животных.

2) Нелинейность. В отличие от обычных эконометрических моделей искусственные нейронные сети обрабатывают поступающие сигналы нелинейно, причём такой нелинейный ответ присущ каждому из элементов этой распределённой системы.

3) Итеративность. Информация, представленная искусственной нейронной сети, как правило, несколько раз и различными способами (в зависимости от выбранного метода обучения) проходит обработку внутри её конструкции. Благодаря этому значительно повышается вероятность сходимости сетей и достижения желаемого оптимума (например, минимизации ошибки), а также появляется возможность их точной настройки под конкретный массив данных.

4) Адаптивность. Искусственные нейронные сети способны реагировать на получаемую обратную связь из внешней среды и адаптироваться к ней. Под адаптацией обычно понимается изменение весов внутри сети (подробнее об этом речь пойдёт ниже), однако существуют и такие сети, которые могут существенно изменять свою архитектуру в ответ на сигналы извне. Например, если внешнее пространство усложняется и требуется больше усилий для обработки поступающей информации, но в сеть может быть добавлено несколько дополнительных нейронов или даже их слоёв.

5) Стандартная архитектура и гибкость в применении. Искусственные нейронные сети достаточно легко поддаются базовой классификации, что определяет основные принципы и относительную простоту их построения. Это, в свою очередь, придаёт сетям универсальность в решении разнообразных задач и
масштабируемость: из двухслойной нейронной сети несложно сделать трёхслойную сеть, обладающую теми же основными параметрами. Кроме этого, в отличие от эконометрических моделей, искусственная нейронная сеть не вменяет исследуемому процессу жёсткие параметры, что обеспечивает гибкость аппроксимации.

6) Работа с контекстной информацией (память). Это качество присуще далеко не всем искусственным нейронным сетям, а только продвинутым моделям (например, сетям Хакена, рекуррентным сетям). Использование контекстной информации является важным преимуществом искусственных нейронных сетей в обработке информации и ещё больше сближает её с биологическими нейронами. Реакция такой сети обусловлена не только конкретными входными значениями, но и их последовательностью, поэтому сеть может эффективно обрабатывать информацию даже из повторяющихся временных рядов. Кроме этого, выходное значение сети будет зависеть от её собственных предсказаний на предыдущих шагах.

Далее мы перейдём к основным принципам построения искусственных нейронных сетей.

Для того чтобы построить любую сеть, необходимо задать ряд важных параметров, которые будут непосредственным образом влиять на её функционирование.

Во-первых, следует определить архитектуру искусственной нейронной сети. Под архитектурой в данном случае понимается конструкция узлов, через которые проходит поступающий в сеть сигнал, а также схема связей между этими узлами. В узлах сети расположены нейроны, которые отвечают за обработку и дальнейшую передачу информации, а взаимосвязь между ними обеспечивается весами. Веса искусственной нейронной сети также выполняют функцию связующих звеньев между различными ансамблями нейронов - слоями.

Такая конструкция также является отсылкой к биологии. Нейрон головного мозга состоит из тела клетки и дендритов - ответвлений, которые получают информацию от других нейронов. В свою очередь, отросток, называемый аксоном, передаёт информацию от данного нейрона к другим. Участки контактов между нейронами называются синапсами (этот термин перекочевал и в искусственные нейронные сети): здесь волна деполяризации проходит по мембране аксона, и происходит передача химического сигнала.

Архитектура искусственной нейронной сети имеет целью воспроизвести эти биологические процессы, причём в простейшем случае слои нейронов расположены линейно. Предполагается, что информационные потоки (x1, x2,...xn) проходят по ним последовательно, один за другим, и преобразуются в значения выходного слоя (y1, y2, ...,ym). Такая сеть называется сетью прямого прохода (feed-forward network), и мы будем активно использовать её при практических построениях в работе.

На рис. 1 изображена двухслойная (входные данные, скрытый, выходной слои) сеть прямого прохода. Заметим, что наличие входных данных и выходного слоя - это обязательное условие построения любой искусственной нейронной сети, а количество скрытых слоёв можно регулировать в зависимости от сложности обрабатываемого массива данных.

Таким образом, чтобы определить архитектуру искусственной нейронной сети нужно минимально задать количество слоёв, количество нейронов в каждом

4

слое и связи между ними. [3]

28

Рис. 1. Схема двухслойной сети прямого прохода

Для лучшего понимания принципа построения искусственной нейронной сети необходимо указать, что входное значение для каждого нейрона скрытого слоя представляет собой взвешенную по весам сумму нейронов предыдущего слоя (на рис. 2 изображён этот механизм для двухслойной сети с одним скрытым нейроном).

Формально это положение запишем так (4):

где S - активация нейрона в скрытом слое, X - входное значение нейрона в предыдущем слое, wi- вес нейрона, n - число нейронов в предыдущем слое, k - номер нейрона скрытого слоя.

Рис. 2. Схема суммирования значений нейронов в скрытом слое

На первый взгляд может показаться, что мы имеем дело лишь со сложной регрессией с большим количеством коэффициентов, однако это не так, потому что архитектура искусственной нейронной сети содержит в себе нелинейное преобразование (важнейшая характеристика нейронных сетей, о которых было сказано выше).

Для нашего примера на рис. 2 это означает, что взвешенная сумма S нейрона скрытого слоя является аргументом нелинейной функции f(S), которая создаёт выходное значение скрытого слоя Y (5):

Использование нелинейной функции преобразования также является отсылкой к биологическим нейронным сетям. В головном мозге человека нейрон, получая информацию от другого нейрона, определённым образом «решает», как реагировать на неё, т.е. передавать сигнал дальше по нейронной сети, или нет. Это называется функцией активации нейрона.

Выбор функции активации является вторым важным шагом при построении искусственных нейронных сетей. Иногда при конструировании искусственных
нейронных сетей применяется пороговая функция активации (threshold function), которая действует по бинарному принципу «всё или ничего» (6):

Однако использование подобной функции активации затрудняет применение дифференциального исчисления. Поэтому гораздо чаще вместо пороговой функции применяют такие функции активации, область значений которых схожа с пороговой.

В практических построениях популярны стандартная логистическая функция с областью значений [0;1] и гиперболический тангенс с областью значений [- 1;1] (7):

Достаточно часто исследователи для повышения эффективности работы сети делают функцию активации не детерминированной, как в (7), а вероятностной, например, путём добавления в неё параметра экспоненциальной зависимости от времени (номера итерации, на которой сеть минимизирует свою ошибку). Мы рассмотрим такой пример в Главе 3.

После того, как минимально необходимая архитектура искусственной нейронной сети (количество слоёв, количество нейронов в них, функция активации всех нейронов) определена, необходимо задать способ обучения сети - третий и, пожалуй, самый важный шаг построения.

Под обучением искусственной нейронной сети подразумевается итеративный процесс оптимизации значений весов (вектор w на рис. 2), которые определяют связи между нейронами и общую эффективность работы сети (некоторые базовые принципы обучения раскрываются в работе [129]).

Итеративный процесс означает, что существует определённая процедура, которая позволяет пошагово двигаться от начального (иногда случайного) значения к оптимуму. При этом, как показывает практика, выбор начального значения далеко не формальный нюанс, а важный фактор, который может существенно повлиять на результаты работы всей нейросетевой модели. Мы более подробно обратимся к этой проблеме в Главе 3.

Принципиально искусственные нейронные сети можно разделить на два типа: обучающиеся с учителем (supervised learning) и самообучающиеся (unsupervised learning). Обучение сети с учителем означает, что нейронной сети сначала предъявляется некоторый набор обучающих примеров, на которых она тренируется, - таким образом программируются потенциальные выходные значения модели, которые должны быть максимально близки к эталонным. Если перед такой искусственной нейронной сетью ставится задача прогнозирования, то традиционно сеть сначала «натаскивают» на обучающем массиве (in-the-sample), а потом, на основе оптимизированных значений принимают решение уже на другом, реальном массиве данных (out-of-sample).[5]К сетям, обучающимися с учителем, можно отнести сети прямого и обратного прохода, рекурретные сети и др. Мы будем работать с такими сетями в Главе 2.

Самообучающиеся искусственные нейронные сети не имеют никаких эталонных примеров и обучаются, задействуя механизмы самоорганизации и конкуренции. Это означает, что мы изначально не можем задать общее пространство выходных значений сети. К самообучающимся сетям относятся, например, сети Кохонена (самоорганизующиеся карты), сети Хопфилда, «машины Больцмана» и др. Мы будем работать с самообучающимися сети в Главе 3.

Можно задаться вопросом о том, какой тип искусственных нейронных сетей, обучающиеся с учителем или самообучающиеся, являются наиболее эффективным, однако такой спор будет непродуктивен. Дело в том, что искусственные нейронные сети, в виду своей гибкости, как правило, создаются под решение конкретной задачи. Это означает, что в одних случаях эффективнее может оказаться один тип сетей, в других - иной. Можно также утверждать, что в определённых условиях можно соединять два типа обучения искусственных нейронных сетей. Мы построим такую модель в Главе 3, где сначала отдельные нейронные сети прямого прохода будут обучаться на эталонной выборке, а на следующем этапе оптимизация их весов будет происходить уже путём конкурентной самоорганизации. Рискнём также предположить, что это не противоречит и фундаментальным законам биологии. В действительности, человеческое мышление гармонично соединяет в себе, как механическое обучение, основанное на подражании (обучение с учителем), так и такие сложные и мало предсказуемые процессы, как творческая деятельность (что отсылает нас к самоорганизации).

Что касается сферы применения искусственных нейронных сетей (помимо прогнозирования финансовых рынков), то на сегодняшний день она достаточно разнообразна. К важной области применения искусственных нейронных сетей относится прогнозирование макроэкономических рядов. В частности, в работе [163] показана несложная нейросетевая модель для предсказания рецессии (падения ВВП) в американской экономике на основе макроэкономических индикаторов - процентных ставок, фондовых индексов, денежных агрегатов и др. Помимо этого, искусственные нейронные сети используются и в других отраслях экономического моделирования, например, в банковском деле для оценки кредитного риска, объёма возврата и просроченной задолженности по кредитам [40, 89, 217].

В заключение добавим, что нейросетевые модели также часто задействуют в моделях и механизмах, задачей которых является распознавание образов. Кроме этого, искусственные нейронные сети являются эффективным аналитическим

инструментом учёных в биологических, медицинских и инженерных исследованиях.

Подведём итоги первой главы. Мы рассмотрели историю исследований искусственных нейронных сетей, которые являются математическими моделями, цель которых - различные способы обработки информационных данных, а иногда даже реконструкция деятельности головного мозга человека. Была теоретически обоснована возможность применения моделей искусственных нейронных сетей (в т.ч., использующих предварительную обработку входных данных) для прогнозирования динамики финансовых рынков как механизма принятия решений репрезентативным агентом, в условия, когда рынки могут отклоняться от информационно эффективного состояния.

Были проанализированы основные характеристики, принципы и необходимые условия построения, а также применяемые способы обучения искусственных нейронных сетей. Кроме этого, на основе одного из главных свойств нейронных сетей - самоорганизации - была прослежена их взаимосвязь с многоагентными системами. При этом отмечалась возможность комбинирования двух этих типов моделей в рамках экспериментов по имитационному взаимодействию на финансовых рынках.

<< | >>
Источник: Головачев Сергей Сергеевич. Прогнозирование доходности на фондовом и валютном рынках на основе моделей искусственных нейронных сетей. Диссертация на соискание ученой степени кандидата экономических наук. Москва - 2014.

Еще по теме Основные характеристики, типология и принципы построения искусственных нейронных сетей при прогнозировании финансовых рынков:

  1. Глава 1. Роль искусственных нейронных сетей в прогнозировании финансовых рынков
  2. Предварительная обработка входных данных искусственными нейронными сетями при прогнозировании финансовых рынков с помощью метода главных компонент и метода независимых компонент
  3. Прогнозирование фондового и валютного рынков с помощью роевой архитектуры искусственных нейронных сетей, использующей кластеризацию данных в качестве инструмента предварительной обработки
  4. 3.1. Прогнозирование финансовых рынков с помощью искусственной нейронной сети Кохонена-Хакена, использующейконкурентную обработку входных данных
  5. Прогнозирование финансовых рынков с помощью искусственной нейронной сети, обученной по методу Левенберга-Марквардта и использующей снижение размерности входных данных (упрощение картины мира)
  6. Прогнозирование фондового и валютного рынков с помощью искусственной нейронной сети Хакена, использующей предварительную обработку входных данных в виде формирования контекстной памяти
  7. Головачев Сергей Сергеевич. Прогнозирование доходности на фондовом и валютном рынках на основе моделей искусственных нейронных сетей. Диссертация на соискание ученой степени кандидата экономических наук. Москва - 2014,
  8. Принятие решений репрезентативным агентом на основе ограниченной рациональности и самоорганизации: имитация с помощью искусственных нейронных сетей
  9. Глава 3. Иллюзия субъективной полноты картины мира, свойственная репрезентативному инвестору, и ее воспроизведение посредством искусственных нейронных сетей, использующих конкурентные механизмы предварительной обработки входных данных
  10. Глава 2. Инвестиционные решения на фондовом и валютном рынках на основе упрощенной картины мира и контекстной памяти - представление в форме искусственных нейронных сетей с предварительной обработкой входных данных
  11. Самоорганизация в искусственных нейронных сетях и на финансовых рынках
  12. ОСНОВНЫЕ ПРИНЦИПЫ ОРГАНИЗАЦИИ И ПРОЦЕДУРЫ АУДИТОРСКИХ ПРОВЕРОК
  13. Эволюция саморегулирования финансовых рынков
  14. ГЛАВА 1. САМОРЕГУЛИРОВАНИЕ В НАЦИОНАЛЬНЫХ СИСТЕМАХ РЕГУЛИРОВАНИЯ ФИНАНСОВЫХ РЫНКОВ
  15. Основные типы систем регулирования финансового рынка в развитых странах
  16. СОДЕРЖАНИЕ И ОСНОВНЫЕ ПРОЦЕДУРЫ АНАЛИЗА ФИНАНСОВО-ХОЗЯЙСТВЕННОЙ ДЕЯТЕЛЬНОСТИ ПО ДАННЫМ БУХГАЛТЕРСКОЙ ОТЧЕТНОСТИ
  17. Фінансова система: сутність, структура та принципи функціонування
  18. Характеристика воздействия государственных доходов на устойчивость коммерческих организации
  19. 3.2. Основы прогнозирования результатов воздействия государственных финансов на устойчивость коммерческих организаци
  20. Специфические характеристики виртуальных организаций в сфере социальных коммуникаций