Главная

Рубрика «llm» - 20

Яндекс разработал и выложил в опенсорс YaFSDP — инструмент для ускорения обучения LLM и сокращения расходов на GPU

2024-06-11 в 9:00, admin, рубрики: gpu, llm, ml, open source, машинное обучение, опенсорс яндекса, языковые модели, яндекс

Сегодня мы выкладываем в опенсорс наш новый инструмент — алгоритм YaFSDP, который помогает существенно ускорить процесс обучения больших языковых моделей.

В этой статье мы расскажем о том, как можно организовать обучение больших языковых моделей на кластере и какие проблемы при этом возникают. Рассмотрим альтернативные методы ZeRo и FSDP, которые помогают организовать этот процесс. И объясним, чем YaFSDP отличается от них.

Читать полностью »

Не статья, а позорище какое-то! Sentiment-анализ комментариев из блога Selectel на Хабре

2024-06-07 в 8:00, admin, рубрики: huggung face, llm, machine learning, selectel, sentiment analysis, аналитика, комментарии, комментарии на хабре, машинное обучение, хабр

Каждый месяц в блоге Selectel на Хабре появляется 35-40 публикаций. Сбор статистики по ним мы давно автоматизировали, но до последнего времени не охватывали sentiment-анализ, то есть оценку тональности комментариев средствами машинного обучения.

У нас есть своя ML-платформа, серверное железо и опыт в развертывании IT-инфраструктуры. Вполне логично, что в какой-то момент возник вопрос: что, если проанализировать эмоциональный окрас комментариев в блоге на Хабре с помощью LLM?

Под катом рассказываем, что из этого получилось.Читать полностью »

ChatGPT как мутная ксерокопия Интернета

2024-05-12 в 18:11, admin, рубрики: chatgpt, llm, natural language processing, Алгоритмы, искусственный интеллект

Читать полностью »

LLMOps: не разрешают использовать ChatGPT. Что можно сделать?

2024-04-18 в 5:30, admin, рубрики: AI, llama, llm

Бывают ситуации, когда жизненные обстоятельства не позволяют использовать ChatGPT и приходится разворачивать LLM локально. Например бабушка не разрешает. Так можно остаться и без AI, а этого мужики точно не поймут. Есть ли какие-то способы решения этой проблемы?

Если у вас такая ситуация – можете выдохнуть, решение есть. На данный момент существуют следующие варианты:

1. Проприетарные модели:

a. Anthropic – в настоящее время сравним или превосходит по качеству ChatGPT 4.0 на некоторых задачах и обладает большим контекстным окном, давая возможность решать многие задачи, не прибегая к RAG и другим гибридным методам

b. Читать полностью »

Как мы научили YandexGPT пересказывать видео

2024-03-04 в 7:00, admin, рубрики: llm, yagpt, yalm, видео, пересказ, яндекс, яндекс.браузер

Читать полностью »

GPT-like модель «впервые сделала научное открытие»: что, как, и куда дальше?

2023-12-18 в 14:28, admin, рубрики: chatgpt, DeepMind, gpt, large language model, large language models, llm, natural language processing, OpenAI, генерация, машинное обучение

14го декабря в одном из самых авторитетных общенаучных журналов Nature была опубликована статья с, кажется, сенсационным заголовком: «ИИ-модели Google DeepMind превосходят математиков в решении нерешённых проблем». А в блогпосте дочки гугла и вовсе не постеснялся указать, что это — первые находки Больших Языковых Моделей (LLM) в открытых математических проблемах. Неужели правда? Или кликбейт — и это в Nature? А может мы и вправду достигли Читать полностью »

Генеративный ИИ — это просто «замыленный JPEG интернета», который убедительно косит под интеллект

2023-11-23 в 5:44, admin, рубрики: chatgpt, gpt, jpeg, llm, галлюцинации, генеративные модели, ИИ, искусственный интеллект, языковые модели

ИИ чат‑боты любят ловить глюки и выдавать всякую чушь. Так массово, что словом 2023 года признали «галлюцинировать». В чем причина такого явления? Является ли генеративный ИИ интеллектом (спойлер — и да, и нет)? И что общего у ChatGPT и копировального аппарата Xerox? Разбираемся, осмысляя базовую логику работы языковых моделей.

Небольшое вступление или "в чем суть проблемы?"

Кебриджский словарь признал Читать полностью »

Неограниченный доступ к знаниям: библиотека Стандартных Шаблонных Конструкций

2023-10-04 в 6:25, admin, рубрики: AI, ipfs, llm, python, библиотеки, наука, научная работа, обход цензуры, свобода информации

Есть много причин почему доступ научным статьям и книгам должен быть свободным:

Это прекрасно.
Знания меняют реальность в лучшую сторону. Вы хотите лечиться у врачей, которые в курсе последних достижений медицины? Летать на безопасных самолетах? Жить в стране, чье сельское хозяйство продуктивно и способно накормить голодные рты? Знать, как воспитывать следующее поколение так, чтобы не было мучительно больно смотреть новости?
Читать полностью »

От полиглота к эксперту: модели mGPT для малых языков России и стран СНГ

2023-08-22 в 9:43, admin, рубрики: llm, low resource languages, mgpt, multilingual language models, nlp, малые языки россии, языковые модели

Не так давно мы рассказывали про то, как обучили модель-полиглот mGPT, которая говорит на 61 языке. Этим летом мы выложили большую мультиязычную модель (претрейн) mGPT-13B под открытой лицензией MIT.

Читать полностью »

Сбер открывает доступ к нейросетевой модели ruGPT-3.5

2023-07-20 в 8:02, admin, рубрики: large language model, llm, natural language processing, nlp, open source, rugpt, ruGPT-3.5, sberdevices, Блог компании SberDevices, Блог компании Сбер, искусственный интеллект, Компьютерная лингвистика, языковые модели

Друзья, свершилось. Сегодня мы рады сообщить вам о релизе в открытый доступ нейросетевой модели, которая лежит в основе сервиса GigaChat.

Про то, что такое GigaChat и как мы его обучаем, вы можете прочитать в нашей предыдущей статье Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Обсуждаемое

Рекомендуем

Рубрика «llm» - 20

Яндекс разработал и выложил в опенсорс YaFSDP — инструмент для ускорения обучения LLM и сокращения расходов на GPU

Не статья, а позорище какое-то! Sentiment-анализ комментариев из блога Selectel на Хабре

ChatGPT как мутная ксерокопия Интернета

LLMOps: не разрешают использовать ChatGPT. Что можно сделать?

Как мы научили YandexGPT пересказывать видео

GPT-like модель «впервые сделала научное открытие»: что, как, и куда дальше?

Генеративный ИИ — это просто «замыленный JPEG интернета», который убедительно косит под интеллект

Небольшое вступление или "в чем суть проблемы?"

Неограниченный доступ к знаниям: библиотека Стандартных Шаблонных Конструкций

От полиглота к эксперту: модели mGPT для малых языков России и стран СНГ

Сбер открывает доступ к нейросетевой модели ruGPT-3.5

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «llm» - 20

Небольшое вступление или "в чем суть проблемы?"

Новости

Актуальные темы

Архив