Архив за 01 августа 2012 - 9

Обучение с подкреплением на нейронных сетях. Теория

2012-08-01 в 2:28, admin, рубрики: Алгоритмы, искусственные нейронные сети, искусственный интеллект, обучение с подкреплением, Спортивное программирование, метки: искусственные нейронные сети, обучение с подкреплением

Я тут написал статью Проблема «двух и более учителей». Первые штрихи, пытаясь показать одну сложную нерешенную проблему. Но первые штрихи оказались немного за сложными. Поэтому я решил для читателей немного разжевать теорию. Увы, сейчас видимо учат/(учатся ?) несколько шаблонно — типа как для каждой задачи свои методы.

Так мне указали, что для задачи классификации — нейронные сети (обучение с учителем), генетические алгоритмы (обучение без учителя) — задача кластеризации, а еще есть обучение с подкреплением (Q-обучение) — как задача агента, которых бродит и что-то делает. И вот такими шаблонами многие и судят.

Попробуем разобраться, что дает применение нейронных сетей, как некоторые заявляют, к задаче которую они не могут решить — а именно к обучению с подкреплением.

И заодно проанализируем диссертацию Бурцев М.С., «Исследование новых типов самоорганизации и возникновения поведенческих стратегий», в которой не больше не меньше красиво сделано именно применение простеньких нейронных сетей в задаче обучения с подкреплением.

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Архив за 01 августа 2012 - 9

Обучение с подкреплением на нейронных сетях. Теория

Архив

Информация

Обсуждаемое

Рекомендуем

Архив за 01 августа 2012 - 9

Обучение с подкреплением на нейронных сетях. Теория

Новости

Актуальные темы

Архив