Я заплатил $200 за ChatGPT Pro. Это гениальная модель, или я выбросил деньги на ветер?

в 17:35, , рубрики: chatgpt, gpt-4, gpt4o, gpto1, gpto1pro, ИИ, нейросети
Я заплатил $200 за ChatGPT Pro. Это гениальная модель, или я выбросил деньги на ветер?

Я заплатил $200 за ChatGPT Pro. Это гениальная модель, или я выбросил деньги на ветер?

Вместе с обновлением от OpenAI вышло первое обновление подписки ChatGPT: ChatGPT Pro. Невероятно дорогая подписка стоимостью 200 долларов ориентирована только на самых продвинутых пользователей ChatGPT. Главный вопрос: стоит ли оно того?

Я постараюсь ответить на него.

Основные моменты

Вот что вы получите в подписке GPT Pro:

  • Неограниченное количество сообщений в чате с 4o, o1 и o1-mini

  • Бесконечный расширенный голосовой режим

  • Доступ к GPT o1-Pro (ограничен 50 сообщениями в неделю)

  • Для всех моделей доступно полное контекстное окно на 128k токенов (в отличие от 32k при обычной подписке)

... да. Вот и все.

Когда я впервые узнал об анонсе, я подумал то же самое, что и вы сейчас. Как это может стоить столько денег?

Хотя бесконечный и расширенный доступ к другим моделям - это здорово, на мой взгляд, главное - это производительность GPT o1-Pro. Если она действительно настолько выше, чем у обычной o1, то, возможно, оно того стоит. Именно поэтому я решил протестировать ее.

GPT o1-Pro

ChatGPT Pro включает в себя самую современную ИИ-модель o1-Pro - настоящее достижение среди LLM. Вопрос в том, насколько она хороша?

По данным OpenAI, она намного умнее и согласованнее, чем o1 или o1-preview (и, соответственно, все остальные LLM на данный момент):

Несколько результатов бенчмарков LLM, показывающих значительные улучшения o1-Pro по сравнению с o1 preview. Источник: https://openai.com/index/introducing-chatgpt-pro/

Несколько результатов бенчмарков LLM, показывающих значительные улучшения o1-Pro по сравнению с o1 preview. Источник: https://openai.com/index/introducing-chatgpt-pro/

У меня не было времени испытать эту модель в реальных условиях, но я провел несколько забавных тестов, чтобы попытаться испытать ее в полной мере.

Тест 1 модели o1-Pro: Преобразование целого приложения

Моя первая задача была очень сложной. Я передал o1-Pro весь код одного из моих приложений на Django и попросил ее конвертировать все для фреймворка Flask.

Это то, с чем не может справиться GPT-4o (слишком много всего и сразу), а o1-preview довольно серьезно провалил эту задачу несколько дней назад, когда я пытался ее выполнить.

В этом приложении нужно было учесть множество моментов, таких как база данных, система аутентификации, интеграция со Stripe, не говоря уже обо всех ИИ-компонентах внутри него.

Однако o1-Pro отлично справилась с задачей и после длительной работы выдала пошаговое руководство по конвертации с написанным кодом для каждого элемента!

Вот несколько скриншотов, которые показывают, насколько масштабной была эта задача. Тем не менее, она была выполнена великолепно!

Вот несколько скриншотов, которые показывают, насколько масштабной была эта задача. Тем не менее, она была выполнена великолепно!

Тест 2 модели o1-Pro - чтение аналоговых часов

Вы можете быть удивлены, обнаружив, что даже GPT-o1 не может считать изображение аналоговых часов:

Я заплатил $200 за ChatGPT Pro. Это гениальная модель, или я выбросил деньги на ветер?

Я заплатил $200 за ChatGPT Pro. Это гениальная модель, или я выбросил деньги на ветер?

Однако o1-Pro обдумывает ситуацию немного дольше и оказывается значительно точнее:

Я заплатил $200 за ChatGPT Pro. Это гениальная модель, или я выбросил деньги на ветер?

Я заплатил $200 за ChatGPT Pro. Это гениальная модель, или я выбросил деньги на ветер?

Этот тест довольно нерезультативен, но тем не менее интересен. Может быть, в фоновом режиме работает новая секретная модель видения, дающая o1-Pro лучшие данные для работы? Возможно...

Тест o1-Pro 3 - Тест шифра

Наконец, я создал тест с шифром, чтобы проверить чистую логическую силу 4o, o1 и o1-Pro. Это простой шифр Цезаря, только для того, чтобы немного усложнить задачу, я убрал несколько букв из перестановки (i, o и некоторые другие). Это означает, что простой тест на перестановку букв не сработает, поэтому требуется логическое мышление, чтобы испытать больше потенциальных решений.

Вот текст, который я зашифрую:

I am not so sure that this model can solve a cipher, because there simply isn’t enough text here to actually get a meaningful answer. However, I could be wrong!

Вот текст в зашифрованном виде:

I ar sox wo wyvj xmax xmiw rohjq gas woqbj a gitmjv, fjgaywj xmjvj wirtqe iws’x jsoylm xjdx mjvj xo agxyaqqe ljx a rjasislkyq aswcjv. Mocjbjv, I goyqh fj cvosl!

Результаты:

GPT-4o полностью провалила тест и не смог правильно ответить.

Однако GPT-o1 справилась с заданием довольно хорошо, его окончательный расшифрованный ответ был следующим:

I am not so sure that this model can solve a cipher, because there isn’t enough text here to actually get a reasonable answer. However, I think it works!

Результат оказался довольно близким, но в некоторых частях он не смог разобраться.

Удивительно, но GPT-o1-Pro показала худшие результаты в этом тесте:

I am not so sure that this cipher can prove a theory, anyway there exists isn’t enough sense here to adequately draw a reasonable conclusion. However, I think it works!

Я был немного разочарован. Но после многочисленных попыток она просто не смогла превзойти o1.

После всего этого тестирования трудно сказать, насколько o1-Pro лучше, чем o1. Однако я планирую опубликовать подробный обзор (с большим количеством реальных примеров использования), чтобы понять, лучше ли он для повседневного использования.

Если вы рассматриваете возможность приобретения подписки только ради доступа к o1-Pro, я бы не стал этого делать.

Окончательный вердикт

Стоит ли вам переходить на GPT-Pro?
По моему мнению, если вы не являетесь полноценным пользователем ChatGPT и он действительно приносит доход, компенсирующий его стоимость, вам лучше остаться на обычной версии Plus.
Вот несколько причин, по которым вы можете захотеть приобрести новую версию подписки, в противном случае я бы не рекомендовал этого делать:

  • Вам нравится расширенный голосовой режим, и вы хотите проводить с ним больше времени

  • Вам очень нужно контекстное окно 128k для всех ваших моделей (если вы пишете длинный контент, это очень важно)

  • У вас постоянно срабатывает ограничение в модели o1 на 50 сообщений в неделю (для меня это было большой проблемой). К слову, в этом телеграм-боте, которым я пользуюсь, - безлимит обращений к модели o1.

В целом, если вы не используете ChatGPT более 1-2 часов в день, то просто не стоит тратить еще 180 долларов.

Хотя я буду продолжать подписку из-за бесконечного лимита сообщений, я не могу сказать, что эта идея подходит для большинства.

Автор: NeyroEntuziast

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js