Главная

Рубрика «natural language processing» - 2

Стоит ли ждать ChatGPT-o1 дома?

2024-10-22 в 15:00, admin, рубрики: llm, machine learning, natural language processing, нейросети

Большие языковые модели прочно засели в новостном пространстве, позволяя изменить подход к огромному количеству задач и дразня новой технологической революцией. Однако основной прогресс LLM сейчас происходит в компаниях, фокусирующихся на предоставлении LLM как сервиса, используя специфические технические и инфраструктурные решения. Это оставляет энтузиастам, собирающим своего собственного локального цифрового помощника, малые модели с открытыми весами. И модели эти, как кажется, будут отставать от старших братьев.

Читать полностью »

о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

2024-09-18 в 5:00, admin, рубрики: chatgpt, gpt, gpt-4, llm, machinelearning, natural language processing, o1, OpenAI, нейросети, языковые модели

Последние пару лет развитие языковых нейросетей как будто бы шло по принципу «больше, длиннее, жирнее»: разработчики пытались раздуть свои модели на как можно большее число параметров и прогнать через них максимальный объем тренировочных данных. 12 сентября OpenAI выпустили новую LLM, которая добавляет в это уравнение еще одно измерение для прокачки: теперь можно масштабировать объем «мыслей», который модель будет тратить в процессе своей работы. В этой статье мы разберемся, чему научилась новая GPT o1, и как это повлияет на дальнейшую эволюцию ИИ.

Читать полностью »

Эмоциональный и искусственный. Учим нейросети понимать социальные взаимодействия людей на AIJ Contest

2024-09-17 в 11:56, admin, рубрики: artificial intelligence, natural language processing, большие языковые модели, мультимодальные модели, соревнования, хакатон, Хакатоны

Мы в лаборатории Fusion Brain уже много лет работаем на созданием мультимодальных моделей, способных работать с как можно большим числом данных разного типа. Не так давно, например, мы релизнули мультимодальную LLM OmniFusion 1.1, способную поддерживать визуальный диалог и отвечать на вопросы по картинкам, причём с поддержкой русского языка — и рассказали об этом на Хабре.

Читать полностью »

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

2024-09-11 в 4:55, admin, рубрики: chatgpt, gpt-4, llm, natural language processing, OpenAI, длиннопост, нейросети, языковые модели

ChatGPT вышел уже почти два года назад, а датасаентисты до сих пор никак не могут определиться — являются ли нейросети тварями дрожащими, или всё же мыслить умеют? В этой статье мы попробуем разобраться: а как вообще учёные пытаются подойти к этому вопросу, насколько вероятен здесь успех, и что всё это означает для всех нас как для человечества.

Читать полностью »

Отличается ли внимание человека и модели-трансформера?

2024-08-30 в 11:36, admin, рубрики: eye-tracking, natural language processing, self-attention, Transformers

Для того, чтобы понимать язык и делать различные выводы, человек рассуждает, опираясь на знания о мире и здравый смысл. Несмотря на то, что большие языковые модели достигли значительных успехов в обработке естественного языка, рассуждение на основе здравого смысла остаëтся одним из самых сложных навыков.

Наиболее распространëнным способом оценки способностей моделей рассуждать, опираясь на здравый смысл, является тест на основе схемы Винограда (The Winograd Schema Challenge Читать полностью »

ChatGPT как мутная ксерокопия Интернета

2024-05-12 в 18:11, admin, рубрики: chatgpt, llm, natural language processing, Алгоритмы, искусственный интеллект

Читать полностью »

GPT-like модель «впервые сделала научное открытие»: что, как, и куда дальше?

2023-12-18 в 14:28, admin, рубрики: chatgpt, DeepMind, gpt, large language model, large language models, llm, natural language processing, OpenAI, генерация, машинное обучение

14го декабря в одном из самых авторитетных общенаучных журналов Nature была опубликована статья с, кажется, сенсационным заголовком: «ИИ-модели Google DeepMind превосходят математиков в решении нерешённых проблем». А в блогпосте дочки гугла и вовсе не постеснялся указать, что это — первые находки Больших Языковых Моделей (LLM) в открытых математических проблемах. Неужели правда? Или кликбейт — и это в Nature? А может мы и вправду достигли Читать полностью »

Диалоги с кофеваркой, про Яндекс Алису и умный дом Home Assistant

2023-09-19 в 6:04, admin, рубрики: bluetooth, homeassistant, natural language processing, яндекс.станция

Умная кофемашина это одно из самых глупых устройств на рынке. Обычно, сразу после включения, в них есть стадия автоматической промывки. И ещё одна перед выключением. Это значит, что вы не можете оставить в кофемашине кружку и приготовить напиток удалённо.

Управление таким прибором с мобильного телефона также очень неудобно. Вам нужно иметь при себе телефон, разблокировать его, найти и запустить приложение, дождаться подключения, настроить напиток. На всё это могут уйти десятки секунд.

Читать полностью »

Сбер открывает доступ к нейросетевой модели ruGPT-3.5

2023-07-20 в 8:02, admin, рубрики: large language model, llm, natural language processing, nlp, open source, rugpt, ruGPT-3.5, sberdevices, Блог компании SberDevices, Блог компании Сбер, искусственный интеллект, Компьютерная лингвистика, языковые модели

Друзья, свершилось. Сегодня мы рады сообщить вам о релизе в открытый доступ нейросетевой модели, которая лежит в основе сервиса GigaChat.

Про то, что такое GigaChat и как мы его обучаем, вы можете прочитать в нашей предыдущей статье Читать полностью »

RuGPT3. Исследование вариантов циклическим перебором

2023-07-02 в 5:32, admin, рубрики: deep learning, gpt, machine learning, natural language processing, nlp, rugpt3, генеративные модели, искусственные нейронные сети, искусственный интеллект, машинное обучение, обработка естественного языка, языковые модели

RuGPT3 - коллекция генеративных моделей от Сбер
Проводим автоматическое тестирование циклическим перебором вариантов

RuGPT3. Исследование вариантов циклическим перебором - 1

Работаем в Colab, тестируем Small, Mediub, Large.
Параметры генерации совершенно неоптимизированы - это первый заход, чтобы посмотреть исходную ситуацию и сравнивать по мере улучшения.
Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Обсуждаемое

Рекомендуем

Рубрика «natural language processing» - 2

Стоит ли ждать ChatGPT-o1 дома?

о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

Эмоциональный и искусственный. Учим нейросети понимать социальные взаимодействия людей на AIJ Contest

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

Отличается ли внимание человека и модели-трансформера?

ChatGPT как мутная ксерокопия Интернета

GPT-like модель «впервые сделала научное открытие»: что, как, и куда дальше?

Диалоги с кофеваркой, про Яндекс Алису и умный дом Home Assistant

Сбер открывает доступ к нейросетевой модели ruGPT-3.5

RuGPT3. Исследование вариантов циклическим перебором

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «natural language processing» - 2

Новости

Актуальные темы

Архив