Главная

Рубрика «o1»

Gemini 2.5 Pro еще ближе к человеку, но реально рассуждать умеют только модели OpenAI

2025-04-01 в 6:16, admin, рубрики: 2.5, claude, deepseek, gemini, Google, o1, PRO, reasoning, искусственный интеллект, нейросети

Моя первая статья на Хабре, хочу поделиться своими находками и мыслями.

На этой неделе вышла новая модель Gemini 2.5 Pro от Google. Много уже было про нее сказано, но я стараюсь не обращать внимания на волны хайпа вокруг новинок, ориентируясь на свои доверенные источники. Одним из них является любительский бенчмарк SimpleBench, который тестирует здравый смысл в реальной жизни. Этот бенчмарк интересен тем, что в нем самый обычный человек набирает 83.7%, а передовые ИИ модели до сих пор не могут даже приблизиться к этому показателю. Пример вопроса (вольный перевод на русский):

Читать полностью »

Стоит ли ChatGPT о1 Pro своих денег? Небольшой тест-драйв модели

2024-12-20 в 15:00, admin, рубрики: chatgpt, chatgpt pro, o1, OpenAI, ИИ, ИИ и машинное обучение

Доброго времени суток. Хотя с релиза новой модели прошло порядка двух недель, мне все равно захотелось протестировать модель, хотя уже и есть различные обзорные материалы. Все-таки, все познается на практике. Поэтому предлагаю меньше слов и больше дела, приглашаю вместе со мной протестировать модель о1 в режиме pro, а также сравнить ее с ChatGPT o1 и ChatGPT 4o, чтобы понять, стоит ли она своих денег.

Читать полностью »

Проигрыватель видео с поддержкой транскрипта

2024-10-11 в 13:31, admin, рубрики: cursor, o1

Читать полностью »

Насколько нейросеть — хороший калькулятор?

2024-09-18 в 14:51, admin, рубрики: chatgpt, gpt, o1, o1-mini, o1-preview, OpenAI

Исследованием поделился Yuntian Deng в Твиттере.
Он протестировал умножение чисел с разным количеством знаков, вплоть до 20.
На примере сравнения o1, o1-mini и gpt-4o.

Оказалось, что GPT4o еле вывозит 4-значные числа, а o1 справляется даже с 9x9.

Насколько нейросеть — хороший калькулятор? - 1

Читать полностью »

о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

2024-09-18 в 5:00, admin, рубрики: chatgpt, gpt, gpt-4, llm, machinelearning, natural language processing, o1, OpenAI, нейросети, языковые модели

Последние пару лет развитие языковых нейросетей как будто бы шло по принципу «больше, длиннее, жирнее»: разработчики пытались раздуть свои модели на как можно большее число параметров и прогнать через них максимальный объем тренировочных данных. 12 сентября OpenAI выпустили новую LLM, которая добавляет в это уравнение еще одно измерение для прокачки: теперь можно масштабировать объем «мыслей», который модель будет тратить в процессе своей работы. В этой статье мы разберемся, чему научилась новая GPT o1, и как это повлияет на дальнейшую эволюцию ИИ.

Читать полностью »

Результаты OpenAI o1, тестирование и заметки о новой модели

2024-09-14 в 4:09, admin, рубрики: chatgpt, o1, OpenAI

o1-previewЗа последние 24 часа мы получили доступ к недавно выпущенным моделям OpenAI, o1-miniспециально обученным для эмуляции рассуждений. Этим моделям дается дополнительное время для генерации и уточнения токенов рассуждений перед тем, как дать окончательный ответ.

Сотни людей спрашивали, как o1 выглядит на ARC Prize. Поэтому мы протестировали его, используя ту же базовую тестовую систему, которую мы использовали для оценки Claude 3.5 Sonnet, GPT-4o и Gemini 1.5. Вот результаты:

Читать полностью »