Новости компании

Свёрточные (CNN) и рекуррентные (RNN) нейронные сети как инструмент инвестиционного анализа

Основа инвестиционной деятельности — это предсказывание будущих финансовых показателей, однако предсказывать их значения задача непростая.

Сложность построения точных прогнозов определяется той же причиной, по которой деньги редко валяются на дороге, слишком много желающих их сразу поднять. Чтобы долгосрочно выигрывать в конкуренции, требуется постоянное совершенствование методов и моделей прогнозирования рынков. И тот, кто обладает лучшим опытом и лучшими методами извлечения закономерностей, получает большую норму прибыли за счёт своих менее оснащённых собратьев.

В последние десятилетия мы видели устойчивый рост популярности индикаторного технического анализа — набора эмпирических правил, основанных на различного рода индикаторах и статистических линейных зависимостях. Линейное моделирование было основным методом работы в большинстве областей, поскольку для него хорошо разработаны процедуры точной оптимизации. Однако в задачах, где линейная аппроксимация неудовлетворительна, линейные модели работают слабо, поэтому с ростом вычислительных мощностей мы наблюдаем рост интереса к нейронным сетям. Поскольку их природа не линейна, они стали исключительно мощным методом моделирования, позволяющим воспроизводить чрезвычайно сложные зависимости, но при этом данные для анализа требуют другого структурирования.

Чтобы использование нейронных сетей давало высокие результаты, в первую очередь нужно правильно понимать структуру и морфологию входных данных для анализа, чтобы под структуру данных строить правильную архитектуру нейронной сети.

Использование такой простой нейронной сети как многослойный персептрон не будет давать нам заметно хороших результатов для прогнозирования временного ряда цен. Поскольку, например, подавая ряд цен на вход, сеть будет искать зависимости в данных, как если бы цены не зависели друг от друга. Или текущие цены не зависели бы от цен прошлых периодов или от возможных экстремумов цен.

Это похоже на то, если бы мы каждую цену рассматривали как отдельный параметр в наборе параметров, не влияющих друг на друга (таких как цвет глаз, рост, возраст и пол человека), в поиске обобщающих зависимостей, влияющих на будущую цену.

Если же мы допускаем, что есть зависимость между ценами нашего временного ряда, мы должны использовать архитектуры, позволяющие работать с такими зависимостями, – как, например, архитектуры свёрточных и рекуррентных нейронных сетей.

Если наше исследование направленно на поиск паттернов для прогноза цены, то мы можем использовать свёрточные (convolutional) нейронные сети, которые используются для распознавания образов. Тем самым мы допускаем, что график состоит из набора паттернов, множество которых мы будем находить и на их основе предсказывать движение цены согласно тому или иному паттерну. Однако мы не сможем в этом случае учитывать влияние паттернов друг на друга. Для этого придётся анализировать полученные паттерны другой сетью и с другой архитектурой – например, рекуррентной нейронной сетью.

Рекуррентные нейронные сети (RNN) чаще используются для анализа таких данных как текст или аудиофайлы, где структура данных предполагает зависимости данных от значений друг друга. Так, например, от контекста, расстановки слов и запятых в тексте может меняться смысл предложения. То есть нейронная сеть анализирует и запоминает такие зависимости, обучаясь находить закономерности в них. Поэтому можно сказать, что для анализа графиков цен такие сети будут более полезны.

Таким образом, следует понимать, что нет универсального подхода для анализа данных с помощью нейронных сетей. И чтобы построить правильную архитектуру, которая будет решать поставленные задачи, нужно иметь наиболее полное представление о морфологии и структуре данных, понимать, как данные организованы и могут быть взаимосвязаны. Если данными являются физические параметры или данные изображений, где законы взаимосвязи данных, их структуры и морфологии наиболее очевидны, и если мы используем данные таких сложных систем как текст или речь, где взаимосвязи более вариативны, то мы должны строить ансамбли нейронных сетей со специализированными архитектурами согласно наиболее точному описанию того, как устроена природа анализируемых данных.

Богдан Згерский (Bogdan Zgersky)
Портфельный управляющий

Источник Investment Letter