Я заплатил $200 за ChatGPT Pro. Это гениальная модель, или я выбросил деньги на ветер?

2024-12-08 в 17:35, admin, рубрики: chatgpt, gpt-4, gpt4o, gpto1, gpto1pro, ИИ, нейросети

Вместе с обновлением от OpenAI вышло первое обновление подписки ChatGPT: ChatGPT Pro. Невероятно дорогая подписка стоимостью 200 долларов ориентирована только на самых продвинутых пользователей ChatGPT. Главный вопрос: стоит ли оно того?

Я постараюсь ответить на него.

Основные моменты

Вот что вы получите в подписке GPT Pro:

Неограниченное количество сообщений в чате с 4o, o1 и o1-mini
Бесконечный расширенный голосовой режим
Доступ к GPT o1-Pro (ограничен 50 сообщениями в неделю)
Для всех моделей доступно полное контекстное окно на 128k токенов (в отличие от 32k при обычной подписке)

... да. Вот и все.

Когда я впервые узнал об анонсе, я подумал то же самое, что и вы сейчас. Как это может стоить столько денег?

Хотя бесконечный и расширенный доступ к другим моделям - это здорово, на мой взгляд, главное - это производительность GPT o1-Pro. Если она действительно настолько выше, чем у обычной o1, то, возможно, оно того стоит. Именно поэтому я решил протестировать ее.

GPT o1-Pro

ChatGPT Pro включает в себя самую современную ИИ-модель o1-Pro - настоящее достижение среди LLM. Вопрос в том, насколько она хороша?

По данным OpenAI, она намного умнее и согласованнее, чем o1 или o1-preview (и, соответственно, все остальные LLM на данный момент):

Несколько результатов бенчмарков LLM, показывающих значительные улучшения o1-Pro по сравнению с o1 preview. Источник: https://openai.com/index/introducing-chatgpt-pro/

У меня не было времени испытать эту модель в реальных условиях, но я провел несколько забавных тестов, чтобы попытаться испытать ее в полной мере.

Тест 1 модели o1-Pro: Преобразование целого приложения

Моя первая задача была очень сложной. Я передал o1-Pro весь код одного из моих приложений на Django и попросил ее конвертировать все для фреймворка Flask.

Это то, с чем не может справиться GPT-4o (слишком много всего и сразу), а o1-preview довольно серьезно провалил эту задачу несколько дней назад, когда я пытался ее выполнить.

В этом приложении нужно было учесть множество моментов, таких как база данных, система аутентификации, интеграция со Stripe, не говоря уже обо всех ИИ-компонентах внутри него.

Однако o1-Pro отлично справилась с задачей и после длительной работы выдала пошаговое руководство по конвертации с написанным кодом для каждого элемента!

Вот несколько скриншотов, которые показывают, насколько масштабной была эта задача. Тем не менее, она была выполнена великолепно!

Тест 2 модели o1-Pro - чтение аналоговых часов

Вы можете быть удивлены, обнаружив, что даже GPT-o1 не может считать изображение аналоговых часов:

Однако o1-Pro обдумывает ситуацию немного дольше и оказывается значительно точнее:

Этот тест довольно нерезультативен, но тем не менее интересен. Может быть, в фоновом режиме работает новая секретная модель видения, дающая o1-Pro лучшие данные для работы? Возможно...

Тест o1-Pro 3 - Тест шифра

Наконец, я создал тест с шифром, чтобы проверить чистую логическую силу 4o, o1 и o1-Pro. Это простой шифр Цезаря, только для того, чтобы немного усложнить задачу, я убрал несколько букв из перестановки (i, o и некоторые другие). Это означает, что простой тест на перестановку букв не сработает, поэтому требуется логическое мышление, чтобы испытать больше потенциальных решений.

Вот текст, который я зашифрую:

I am not so sure that this model can solve a cipher, because there simply isn’t enough text here to actually get a meaningful answer. However, I could be wrong!

Вот текст в зашифрованном виде:

I ar sox wo wyvj xmax xmiw rohjq gas woqbj a gitmjv, fjgaywj xmjvj wirtqe iws’x jsoylm xjdx mjvj xo agxyaqqe ljx a rjasislkyq aswcjv. Mocjbjv, I goyqh fj cvosl!

Результаты:

GPT-4o полностью провалила тест и не смог правильно ответить.

Однако GPT-o1 справилась с заданием довольно хорошо, его окончательный расшифрованный ответ был следующим:

I am not so sure that this model can solve a cipher, because there isn’t enough text here to actually get a reasonable answer. However, I think it works!

Результат оказался довольно близким, но в некоторых частях он не смог разобраться.

Удивительно, но GPT-o1-Pro показала худшие результаты в этом тесте:

I am not so sure that this cipher can prove a theory, anyway there exists isn’t enough sense here to adequately draw a reasonable conclusion. However, I think it works!

Я был немного разочарован. Но после многочисленных попыток она просто не смогла превзойти o1.

После всего этого тестирования трудно сказать, насколько o1-Pro лучше, чем o1. Однако я планирую опубликовать подробный обзор (с большим количеством реальных примеров использования), чтобы понять, лучше ли он для повседневного использования.

Если вы рассматриваете возможность приобретения подписки только ради доступа к o1-Pro, я бы не стал этого делать.

Окончательный вердикт

Стоит ли вам переходить на GPT-Pro?
По моему мнению, если вы не являетесь полноценным пользователем ChatGPT и он действительно приносит доход, компенсирующий его стоимость, вам лучше остаться на обычной версии Plus.
Вот несколько причин, по которым вы можете захотеть приобрести новую версию подписки, в противном случае я бы не рекомендовал этого делать:

Вам нравится расширенный голосовой режим, и вы хотите проводить с ним больше времени
Вам очень нужно контекстное окно 128k для всех ваших моделей (если вы пишете длинный контент, это очень важно)
У вас постоянно срабатывает ограничение в модели o1 на 50 сообщений в неделю (для меня это было большой проблемой). К слову, в этом телеграм-боте, которым я пользуюсь, - безлимит обращений к модели o1.

В целом, если вы не используете ChatGPT более 1-2 часов в день, то просто не стоит тратить еще 180 долларов.

Хотя я буду продолжать подписку из-за бесконечного лимита сообщений, я не могу сказать, что эта идея подходит для большинства.

Автор: NeyroEntuziast

Источник

Информация

Обсуждаемое

Рекомендуем