Публичный релиз DeepSeek, обрушивший капитализацию связанных с ИИ гигантов бигтеха на триллион долларов, и ставший самым громким событием с выхода в открытый доступ ChatGPT, напомнил многим об идущем стремительными темпами прогрессе в сфере LLM. И многие из тех людей, которые не нашли применения ChatGPT кроме как игрушки сразу после его релиза в конце 2022 года или даже не пробовали работать с нейросетями вообще, сейчас, уже почти 2,5 года спустя, могут обнаружить полезные, в первую очередь, в работе варианты применения нейросетей благодаря DeepSeek и его медийному эффекту.
Давно не писал статей на хабр, потому что редко находится что-то действительно полезное.
Я подписан в Telegram на десяток новостных каналов про ИИ, но только недавно с удивлением для себя обнаружил, что гугл даёт делать 1500 бесплатных запросов в сутки на свои модели Gemini, что вполне достаточно для создания прототипа или даже небольшого pet-проекта. Как по мне так это неплохой способ начать экспериментировать с gpt-моделями, при этом ничего не платить и не возиться с банковской картой.
В прошлой статье я развлекался беседами с лампочками (24В, 250Вт). А раз завелась говорящая лампочка, то пусть не просто так спиралью болтает, а подкасты ведет. Тем более, что тут Gemini 2.0 вышел: хороший повод попросить ИИ порефлексировать о самом себе и выразить это через роботов-аватаров.
Большинство тестов для оценки ИИ-моделей не слишком информативны: они часто сводятся к простому запоминанию ответов или касаются тем, которые не всегда актуальны для пользователей. Поэтому некоторые ИИ-энтузиасты используют игры как способ оценки навыков решения задач.
Пол Калкрафт, независимый разработчик, создал приложение, где ИИ-модели играют в игру, похожую на «Крокодил» (Pictionary). Одна модель рисует, а другие пытаются угадать, что изображено.
Сегодня увидел на репетиторском канале (https://t.me/mimimaths) простенькую задачку на логику. И решил попробовать скормить ее ChatGPT и Gemini. Просто интереса ради. Вспомнил, что когда вышла ChatGPT 4-o в демках показывали, как она якобы может заменить учителей.
Серия Gemini 1.5 представляет собой набор моделей, разработанных для обеспечения высокой производительности в выполнении разнообразных задач, включая текстовые, кодовые и мультимодальные. Эти модели могут использоваться для таких сложных задач, как синтез информации из 1000-страничных PDF-файлов, ответов на вопросы о больших репозиториях кода, содержащих более 10 тысяч строк, а также анализа многочасовых видеороликов и генерации из них полезного контента.
Гемини можно использовать нативно, и для этого не нужен никакой ВПН (но, возможно, нужна уже привязанная карта банка к гуглу. Даже если это российская визовая карта, которая уже не работает). По поводу совместимости смартфонов с гемини ничего сказать не могу, если загуглить, то гугл говорит "о многих смартфонах". Если у вас пиксель 6, кажется, или новее, то 100% заработает. Либо же всегда можно воспользоваться официальным сайтом с чат ботом.
Первым делом - меняем регион гугл аккаунта на США: