Рубрика «покер»

На протяжении десятилетий покер был сложной и важной проблемой в области искусственного интеллекта. Игра включает в себя скрытую информацию — вы не знаете карты ваших оппонентов — поэтому успех требует применения нескольких стратегий. Каждый игрок корректирует поведение исходя из своего представления о том, что ожидает противник, и исходя из накопленной статистики (если речь об онлайн-покере со вспомогательным статистическим ПО). Ценность действия в игре с неполной информацией зависит от вероятности, с которой оно выбрано, и от вероятности, с которой выбраны другие действия.

Такие нюансы сделали покер устойчивым к методам обучения ИИ, которые добились успеха в других играх. Казалось, компьютеры никогда не смогут успешно играть в покер против людей. Но теперь ясно, что все ошибались.

В последние годы новые методы смогли победить лучших людей в хэдзапе (бот Libratus). А сейчас достигнута ключевая веха: бот Pluribus, разработанный в университете Карнеги — Меллона и Facebook, победил элитных игроков за столом с шестью игроками (научная статья опубликована в Science). Что характерно, самообучение программы проводилось на одном 64-ядерном сервере с 512 ГБ памяти. Это не какие-то корпоративные проекты, где нейросеть обучается на десятках тысяч процессорных ядер. Обучение программы вроде Pluribus может повторить практически любой исследователь.
Читать полностью »

Стратегического покерного бота Libratus адаптировали для военных симуляторов - 1В 2017 году покерный бот Libratus попал в заголовки СМИ, когда обыграл четырёх профессионалов в безлимитный холдем на дистанции 120 000 рук. Теперь технологию адаптировали для военного применения.

Разработчики систем слабого ИИ часто сравнивают эффективность своих программ в игровом противостоянии против человека. В играх с полной информацией в любой момент игры все игроки имеют полную информацию о состоянии игры, то есть о позиции и всех возможных ходах любого из игроков. В отличие от таких детерминированных ситуаций, в играх с неполной информацией часть информации о состоянии игры скрыта от игрока — например, карты оппонента. Безлимитный холдем как раз одна из таких игр. Кроме закрытых карт оппонента, добавляется здесь элемент неопределённости за счёт произвольного размера каждой ставки. С учётом этого количество возможных исходов оценивается в 10161. Выработка оптимальной стратегии в условиях неопределённости с учётом тактики оппонента — именно то, что нужно военным.
Читать полностью »

image

О том как совершенствуется искусственный интеллект, можно судить по обычным играм. За последние два десятилетия алгоритмы превзошли лучших мировых игроков: сначала пали нарды и шашки, затем шахматы, «Своя Игра» (Jeopardy!), в 2015 году — видеоигры Atari и в прошлом году — Го.

Все эти успехи — про игры с информационной симметрией, где игроки имеют идентичную информацию о текущем состоянии игры. Это свойство полноты информации лежит в основе алгоритмов, обеспечивающих эти успехи, например, локальном поиске во время игры.

Но как обстоит дело с играми с неполной информацией?

Самым наглядный пример такой игры — покер. Чтобы на деле разобраться с этой игрой и алгоритмами решения этой задачи, мы организуем хакатон по написанию игровых ботов на основе машинного обучения. О том как научить алгоритмы блефовать и попробовать свои силы в покер, не трогая карты, под катом.

Читать полностью »

image

Доброго времени суток всем! Несколько дней назад была опубликована статья на GeekTimes: «Взять и победить: ИИ выиграл покерный турнир у четырех профи» и я хочу немного оспорить значимость этой победы.

Прежде всего хочу сказать, что я внимательно следил за происходящими событиями. Мне даже удалось получить ответы на интересующие вопросы от Carnegie Mellon University и профессионального игрока Джейсона Леса. Вообще к теме победы ИИ в покере отношусь очень серьёзно. Это не шахматы или какие-нибудь нарды, где компьютер способен намного оперативние просчитывать видимые ходы и вероятности.

В большинстве своём люди учатся на собственных ошибках. Редко когда на чужих. Общество совершает одни и те же ошибки снова и снова. Искусственный интелект развивается подругому. Если автопилот допускает ошибку, остальные самоуправляемые машины станут умнее. Все новопроизведенные автомобили будут созданы с полным набором навыков своих предков. Таким образом коллективное обучение ИИ, может происходить быстрее, чем у людей — Эрик Шмидт, Себастьян Трун.

Читать полностью »

ИИ: блеф, отъем денег у населения и победа над неопределенностью - 1

Прямо сейчас, пока вы читаете эти строки, в мире происходит удивительное событие — искусственный интеллект побеждает человека в очередной игре. Удивителен не сам факт превосходства машин, а то, что об этом мало пишут. Возможно, в связи с тем, что на этот раз машина состязается не в легендарную игру «го», не в DOOM, лапту или прятки, а в спортивный карточный покер.

Покер часто пренебрежительно называют азартной игрой, выигрыш в которой зависит исключительно от случая, но его на сегодняшний день в законодательном порядке признали официальным видом спорта в целом ряде стран (за исключением России). Самое интересное для нас и машин в том, что в покере выигрышные стратегии можно спрогнозировать при помощи теории вероятности. И самое главное, покер — это игра с неполной информацией, в отличие от шахмат, шашек, нард, где оба игрока видят положение всех фигур на доске. Ранее ИИ не мог победить там, где присутствует элемент неопределенности. Так что же изменилось?
Читать полностью »

Покерная программа DeepStack обыгрывает профессионалов один на один - 1
Дерево решений программы DeepStack в хедс-апе (игре один на один) безлимитного холдема на префлопе, флопе и тёрне

Пионер современной теории игр Джон фон Нейман говорил: «Реальная жизнь вся состоит из блефа, из маленьких приёмов обмана, из размышлений о том, каких действий ожидает от тебя другой человек. Вот что представляет игра в моей теории» (цитата из 13-й серии документального сериала «Возвышение человечества»).

Другими словами, Джон фон Нейман предвидел, что для создания сильного ИИ компьютер должен научиться играть в игры с неполной информацией, которые наиболее соответствуют человеческому поведению в реальной жизни. Такие игры как покер.
Читать полностью »


Первое видео курса

Массачусетский технологический институт выложил в свободный доступ курс лекций по теме «Теория и аналитика игры в покер» (на английском языке). Доступны видеолекции, конспекты и специальные заметки по курсу. Это событие – часть программы OpenCourseWare, которая посвящена организации бесплатного доступа к избранным лекциям института для всех желающих – даже для тех, кто не учится в нём.

Помните, как в школе многие говорят: «Ну зачем мы это учим, нам это не пригодится!»?

Так вот, лекции по покеру – пожалуй, могут оказаться не просто интересными, но и весьма полезными с практической точки зрения.

Лекции ведёт магистрант института Кевин Дезмонд, который получил степень бакалавра по финансам. И, что логично, его лекции как раз рассказывают о технологиях анализа и планирования, предназначенных для максимизации выгоды от игры на деньги.

В курсе рассматриваются основы игры, наилучшие стратегии, и те важные детали, которые самоучки обычно упускают. Рассматривается анализ поведения игроков, манеры игры и прогнозы их будущих действий в зависимости от предыдущих раздач.
Читать полностью »

«Победа» профессионалов над покерной программой статистически является ничьей - 1
Туомас Сандхолм (Tuomas Sandholm), профессор компьютерных наук университета Карнеги-Меллона, ведущий разработчик компьютерной программы Claudico

8 мая завершился необычный покерный турнир, в котором четверым из Топ-10 лучших игроков в техасский холдем противостояла компьютерная программа Claudico. Результат соревнования “Brains Vs. Artificial Intelligence” оказался в пользу людей: у них был положительный баланс по итогам 20 000 раздач в двусторонней игре.

Тем не менее, фактическая победа не означает, что на самом деле люди сильнее ИИ в покере. Эксперты в области таких соревнований объясняют, что сыгранных рук и результата недостаточно для формального определения победителя, так что де-факто результатом стала «статистическая ничья».
Читать полностью »

Четверо лучших в мире игроков в покер соревнуются с программой под названием Claudico на чемпионате «Brains Vs. Artificial Intelligence» в казино в Питтсбурге. В течение двух недель программа сыграет в Техасский холдем один на один с живыми игроками.

Живые участники чемпионата пока выигрывают.

image
Дуг Полк против Claudico
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js