Рубрика «reinforecement learning»

Обзор примера применения обучения с подкреплением с использованием TensorFlow

2016-01-07 в 21:31, admin, рубрики: artificial intelligence, decision making, deep q-learning, reinforecement learning, TensorFlow, математика, нейронные сети, обучение с подкреплением, Программирование, управление

КПДВ. В Karpathy game играет нейронная сеть

Всем привет!
Я думаю, что многие слышали о Google DeepMind. О том как они обучают программы играть в игры Atari лучше человека. Сегодня я хочу представить вам статью о том, как сделать нечто подобное. Данная статья — это обзор идеи и кода примера применения Q-learning, являющегося частным случаем обучения с подкреплением. Пример основан на статье сотрудников Google DeepMind.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «reinforecement learning»

Обзор примера применения обучения с подкреплением с использованием TensorFlow

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «reinforecement learning»

Обзор примера применения обучения с подкреплением с использованием TensorFlow

Новости

Актуальные темы

Архив