Большинство тестов для оценки ИИ-моделей не слишком информативны: они часто сводятся к простому запоминанию ответов или касаются тем, которые не всегда актуальны для пользователей. Поэтому некоторые ИИ-энтузиасты используют игры как способ оценки навыков решения задач.
Пол Калкрафт, независимый разработчик, создал приложение, где ИИ-модели играют в игру, похожую на «Крокодил» (Pictionary). Одна модель рисует, а другие пытаются угадать, что изображено.