Главная

Метка «многорукие бандиты»

Многорукие бандиты: модель dynamic Gamma-Poisson

2013-02-15 в 16:11, admin, рубрики: surfingbird, Алгоритмы, Блог компании Surfingbird, искусственный интеллект, многорукие бандиты, обучение с подкреплением, рекомендательные системы, метки: surfingbird, Алгоритмы, многорукие бандиты, обучение с подкреплением, рекомендательные системы

В прошлый раз мы рассмотрели общую постановку задачи о многоруких бандитах, обсудили, зачем это может быть нужно, и привели один очень простой, но эффективный алгоритм. Сегодня я расскажу о ещё одной модели, которая эффективна в ситуациях, когда ожидаемые доходы от бандитов меняются со временем, да и само число и состав «ручек» может меняться – о динамической гамма-пуассоновской модели.

Многорукие бандиты: модель dynamic Gamma Poisson
Читать полностью »

Многорукие бандиты: введение и алгоритм UCB1

2013-02-07 в 9:57, admin, рубрики: surfingbird, Алгоритмы, Блог компании Surfingbird, искусственный интеллект, многорукие бандиты, обучение с подкреплением, рекомендательные системы, метки: surfingbird, Алгоритмы, многорукие бандиты, обучение с подкреплением, рекомендательные системы

Это первый пост из блога Surfingbird, который я выношу в общие хабы алгоритмов и искусственного интеллекта; честно говоря, раньше просто не догадался. Если интересно, заходите к нам, чтобы прочесть предыдущие тексты, – я не знаю, что произойдёт, если просто добавить новые хабы к постам несколькомесячной давности.

Краткое содержание предыдущих серий о рекомендательных системах:

В этот раз начинаем новую тему – о многоруких бандитах. Бандиты – это самая простая, но от этого только более важная постановка задачи в так называемом обучении с подкреплением…

Многорукие бандиты: введение и алгоритм UCB1
Читать полностью »