В рамках своей диссертации «Модель прогнозирования по выборке максимального подобия» мне нужно было делать обзор моделей прогнозирования. Кроме обзора, я сделала вариант классификации, который мне тогда не очень удался. Классификацию уже немного поправила, теперь хочется разобраться в существующих моделях прогнозирования временных рядов. Такие модели называют стохастическими моделями (stochastic models).
По оценке некто Тихонова в его «Прогнозировании в условиях рынка» на сегодняшний день (2006 год) существует около 100 методов и моделей прогнозирования. Эта оценка звучит бредово, я полно разбирала ее! Давайте теперь вместе разберемся, какие же модели прогнозирования временных рядов существуют на сегодняшний день.
- Регрессионные модели прогнозирования
- Авторегрессионные модели прогнозирования (ARIMAX, GARCH, ARDLM)
- Модели экспоненциального сглаживания (ES)
- Модель по выборке максимального подобия (MMSP)
- Модель на нейронных сетях (ANN)
- Модель на цепях Маркова (Markov chains)
- Модель на классификационно-регрессионных деревьях (CART)
- Модель на основе генетического алгоритма (GA)
- Модель на опорных векторах (SVM)
- Модель на основе передаточных функций (TF)
- Модель на нечеткой логике (FL)
- Что еще?...
Регрессионные модели прогнозирования
Регрессионные модели прогнозирования одни из старейших, однако нельзя сказать, что она нынче очень популярны. Регрессионными моделями являются:
- Простая линейная регрессия (linear regression)
- Множественная регрессия (multilple regression)
- Нелинейная регрессия (nonlinear regression)
Лучшая книга по регрессии — архигениальная книга — Draper N., Smith H. Applied regression analysis. Ее можно скачать в сети в djvu. Лучше читать в английском варианте, написано в высшей степени для людей.
Авторегрессионные модели прогнозирования
Это широчайший и один из двух наиболее широко применимых классов моделей! Книг по этим моделям много, примеров применения много.
- ARIMAX (autoregression integrated moving average extended), об этом написано чрезвычайно много. Основой основ является книга Box, George and Jenkins, Gwilym (1970) Time series analysis: Forecasting and control. Лучше читать на английском!
- GARCH (generalized autoregressive conditional heteroskedasticity), здесь множество модификаций FIGARCH, NGARCH, IGARCH, EGARCH, GARCH-M.
- ARDLM (autoregression distributed lag model), об этом только в учебниках по эконометрике.
Вопрос к аудитории: посоветуйте хорошую и понятную (!) книгу/статью по GARCH и MLE.
Модели экспоненциального сглаживания
- Экспоненциальное сглаживание (exponential smoothing)
- Модель Хольта или двойное экспоненциальное сглаживание (double exponential smoothing)
- Модель Хольта-Винтерса или тройное экспоненциальное сглаживание (triple exponential smoothing)
По всем трем моделям лучшая из мною читанного статья Prajakta S.K. Time series Forecasting using Holt-Winters Exponential Smoothing.
Модель по выборке максимального подобия
Это моя модель (model on the most similar pattern), на ряде задач показывает высокую эффективность. К рядам FOREX и бирж применять не стоит, проверяли, работает неважно. Ее описание можно найти в диссертации по ссылке выше, кроме того, можно скачать пример реализации в MATLAB.
Модель на нейронных сетях
Вторая из двух наиболее популярных моделей прогнозирования временных рядов. Лучшая книга с примерами, на мой вкус, Хайкин С. Нейронные сети: полный курс. Книгу с примерами в MATLAB можно скачать по ссылке.
Модель на цепях Маркова
Модель на цепях Маркова фигурирует в множестве обзоров, однако мне не удалось найти ни хорошей книги, ни хорошей статьи о ее конкретном применении для прогнозирования временных рядов. Сама эту модель разбирала в курсе теории надежности (учебник Гнеденко), принцип ее расчета хорошо понимаю, кроме того, читала, что ее часто применяют для моделирования финансовых временных рядов.
Вопрос к аудитории: посоветуйте хорошую и понятную (!) книгу/статью по применению цепей Маркова для прогнозирования временных рядов.
Модель на классификационно-регрессионных деревьях
Вот тут материалов немного, но они есть. В частности, неплохая статья по применению этой модели для прогнозирования Hannes Y.Y., Webb P. Classification and regression trees: A User Manual for IdentifyingIndicators of Vulnerability to Famine and Chronic Food Insecurity.
Модель на основе генетического алгоритма
Это странный зверь, такого рода решения я называю «иезуитскими», потому что кажется, что они рождены только для обоснования научной новизны, однако эффективность их невысока. Например, генетический алгоритм применяется для решения задач оптимизации (поиска экстремума), однако некоторые приплели его к прогнозированию временных рядов. Найти внятного материала по этой теме мне не удалось.
Вопрос к аудитории: посоветуйте хорошую и понятную (!) книгу/статью по применению генетического алгоритма для прогнозирования временных рядов.
Модель на опорных векторах
Модель на основе передаточных функций
Модель на нечеткой логике
Все эти модели принадлежат, на мой вкус, классу иезуитских. Например, опорные векторы (SVM) применяется в основном для задач классификации. Нечеткая логика где только не применяется, однако найти ее понятно описанное применение для прогнозирования временных рядов мне не удалось. Хотя в обзорах специалисты почти всегда ее указывают.
Вопрос к аудитории тот же!
Итого
Моделей мы наберем с десяток, со всеми модификациями — два десятка. Хотелось бы, чтобы в комментариях вы не только высказывали мнение, а по возможности делали полезные ссылки на понятные материалы. Лучше на английском!
PS. Всех любителей FOREX и всякого рода бирж большая просьба не долбится ко мне в личку! Вы мне ужасно надоели!
Автор: