По словам генерального директора компании Сэма Альтмана, следующее поколение систем искусственного интеллекта сможет самостоятельно выполнять задачи без участия человека, и это становится возможным благодаря таким моделям, как новая модель o1 от OpenAI.
Дисклеймер 1: это вольный перевод колонки Раяна Моррисона, которую он написал для портала Tom's Guide. Перевод подготовила редакция «Технократии». Чтобы не пропустить анонс новых материалов подпишитесь на «Голос Технократии» — мы регулярно рассказываем о новостях про AI, LLM и RAG, а также делимся полезными мастридами и актуальными событиями.
Выступая на мероприятии T-Mobile Capital Markets Day, Альтман высоко оценил достоинства моделей o1 и их способность "рассуждать". Он утверждает, что это откроет совершенно новые возможности для ИИ, которые ранее были недоступны с предыдущими моделями класса GPT.
Альтман считает, что эти рассуждающие модели, способные прорабатывать проблему перед предоставлением решения, позволят развить ИИ третьего уровня, который он описывает как агентные системы.
Агентные системы — это когда ChatGPT сможет эффективно действовать самостоятельно, чтобы предоставить пользователю наилучший возможный ответ, включая выполнение задач в других сервисах. Это приведёт к четвёртому уровню — системам, способным к инновациям.
В чём же основное изменение в ИИ?
Во время беседы у Альтман признал сильные стороны текущей серии моделей GPT, включая GPT-4, которая лежит в основе ChatGPT и Advanced Voice. Эти модели изначально мультимодальны, но работают, как и любой предыдущий ИИ, — токен за токеном.
«Модели серии GPT прекрасно справлялись с мышлением типа "система-1", но нам нужны были системы, способные рассуждать. Если ИИ может рассуждать над проблемами, это будет иметь огромную ценность. o1 — первая система, способная к сложным рассуждениям, и если вы дадите ей сложную задачу, вы получите поразительные результаты». — Сэм Альтман
Здесь "система 1" относится к быстрым, интуитивным и автоматическим когнитивным процессам. "Система 2", к которой стремятся модели с o1, подразумевает более осознанное, логическое мышление, хотя и более медленное. Эти системы описывал Даниэль Канеман, один из основоположников поведенческой экономики и нобелевский лауреат.
Альтман подчеркнул значимость этого прогресса: «Этот подход со временем это будет выглядеть столь же значительным, как выход GPT. Представьте, что существующие модели, способные к рассуждению, находятся на уровне GPT-2, но совсем скоро они достигнут уровня GPT-4».
Иными словами, модели с логическим размышлением сейчас находятся на ранней стадии развития: o1-preview примерно соответствует GPT-2, который предшествовал запуску ChatGPT в ноябре 2022 года.
Несмотря на раннюю стадию, он выразил уверенность в быстром прогрессе: «Но уже в ближайшие месяцы вы увидите обновления, когда мы перейдём от o1-preview к o1. Кривая улучшений очень крутая, и то, что модели не могут решить сегодня, они смогут решить через несколько месяцев».
Альтман также отметил потенциал для новых и инновационных приложений: «Мы увидим совершенно новые способы использования этих моделей... Мы настолько на ранней стадии с o1, что появятся новые методы её применения, и нам с пользователями потребуется время, чтобы разобраться, как это делать».
Почему o1 так важен?
OpenAI o1 — это совершенно новый класс больших языковых моделей. Предыдущие поколения и подходы, включая семейство GPT, отвечали на запрос пользователя токен за токеном, что часто приводило к галлюцинациям или полностью некорректной информации.
Существуют несколько методов обхода этой проблемы, включая увеличенные окна контекста, позволяющие ИИ иметь доступ к ранее исправленным деталям, и функции памяти, которые делают то же самое, но через несколько чатов. Однако это лишь временные решения, и требовалась смена парадигмы.
С o1 OpenAI изменила подход, перейдя к концепции "цепочки мыслей", где после того, как вы даёте модели ИИ запрос, она уходит и прорабатывает проблему шаг за шагом, примерно так же, как человек размышляет над задачей перед тем, как предоставить ответ. Уверен, многим из нас снижали оценки в школе за то, что не показывали своё решение должным образом; так вот, теперь ИИ тоже должен демонстрировать ход своих мыслей.
Выступая перед представителями компании T-Mobile, Альтман назвал здравоохранение и образование отличными областями, где такие модели, как o1, могут оказать значительное влияние. "Если представить, что каждый ученик получает индивидуальное обучение, созданное специально для него, а также другие возможности для обучения", - это очень важно. Он очень надеется, что ИИ поможет сделать научные открытия. "Если ИИ поможет нам изобрести новые вещи, лечить болезни, придумать лучшие источники энергии, это будет огромной победой".
Альтман завершил выступление, вновь подчеркнув приверженность OpenAI глубокому обучению и их веру в путь к искусственному общему интеллекту (AGI), при этом оставаясь открытыми к изменению своего подхода на основе постоянного обучения. Он представляет будущее, в котором AI-агенты, обеспеченные этой технологией, окажут огромное влияние на мир.
Альтман говорит, что мы должны ожидать первую полноценную версию o1, а не mini или preview, в ближайшие месяцы, а o2 и версии следующего поколения — в ближайшие годы. Неясно, станет ли семейство моделей "o" агентами или это будет ещё одна смена парадигмы, подобная переходу от GPT к o.