Рубрика «машинное обучение» - 15

YandexGPT в Браузере: как мы учили модель суммаризировать статьи

2023-07-06 в 7:58, admin, рубрики: yandexgpt, Блог компании Яндекс, браузеры, искусственный интеллект, команда яндекс.браузера, краткий пересказ, машинное обучение, суммаризация, яндекс

Неделю назад на сайте 300.ya.ru мы продемонстрировали возможности языковой модели YandexGPT применительно к задаче суммаризации текстов. С тех пор многое изменилось: мы обучили новую, более качественную модель, в пересказах которой в 4 раза меньше ошибок. А сегодня мы внедрили её в Яндекс Браузер. Может показаться, что мы просто взяли ту же модель, о которой уже рассказывали сообществу на примере Алисы, и прикрутили к ней кнопку в Браузере. Но не всё так просто. Да, наша базовая модель уже понимала, что такое суммаризация в общих чертах. Но для нас было важно добиться результата в нужной нам форме и с предсказуемым качеством. И вот тут-то начинаются нюансы.

Сегодня поделюсь с Хабром не столько новостью, сколько нашим опытом и советами из области дообучения моделей и промпт-инжиниринга. Расскажу, через что пришлось пройти нашей команде, чтобы модель начала делать то, что от неё ожидают.

Читать полностью »

Кодеки новой эпохи: HEVC, AV1, VVC и нейросети

2023-07-03 в 9:00, admin, рубрики: AV1, avc, CAE, content-aware encoding, H.264, H.265, Harmonic, HEVC, netflix, ruvds_статьи, VVC, WaveOne, Алгоритмы, Блог компании RUVDS.com, ИИ-кодеки, кодеки, машинное обучение, машинное обучение кодеков, нейронное улучшение, Работа с видео, сжатие данных, сжатие с учетом контента

Сжатие с учётом контекста, источник: WaveOne (сайт удалён)

Хотя новые стандарты кодеков появляются каждые десять лет, все они основаны на пиксельной математике — манипулировании значениями отдельных пикселей в видеокадре для удаления информации, не важной для восприятия. Другие математические операции уменьшают объём данных после первоначального кодирования.

В новом поколении кодеков алгоритмы машинного обучения используются для анализа и понимания визуального содержания видео, выявления избыточных данных и более эффективного сжатия. Вместо написанных вручную алгоритмов, тут применяют методы Software 2.0, основанные на обучении. Данная область развивается на протяжении десятилетий, но в последние годы получила сильный толчок. Все знают, что в 2017 году произошёл прорыв в разработке ИИ благодаря изобретению трансформеров. В свою очередь, они основаны на концепции внимания, которую придумали в 90-е. Эта техника впервые позволила соотносить друг с другом отдельные части текста или видеокадра.
Читать полностью »

RuGPT3. Исследование вариантов циклическим перебором

2023-07-02 в 5:32, admin, рубрики: deep learning, gpt, machine learning, natural language processing, nlp, rugpt3, генеративные модели, искусственные нейронные сети, искусственный интеллект, машинное обучение, обработка естественного языка, языковые модели

RuGPT3 - коллекция генеративных моделей от Сбер
Проводим автоматическое тестирование циклическим перебором вариантов

RuGPT3. Исследование вариантов циклическим перебором - 1

Работаем в Colab, тестируем Small, Mediub, Large.
Параметры генерации совершенно неоптимизированы - это первый заход, чтобы посмотреть исходную ситуацию и сравнивать по мере улучшения.
Читать полностью »

Обзор бесплатных ботов ChatGPT в телеграме

2023-06-25 в 11:07, admin, рубрики: Bothub, chatgpt, Google, GShard, Midjorney, OpenAI, XLA, искусственный интеллект, машинное обучение, мессенджеры, Софт

Недавно мы писали про бесплатные фронтенды к ChatGPT, созданные главным образом по причине блокировки ОpenAI в РФ. Но технологии не стоят на месте — и сейчас уже в ходу телеграм-боты того же предназначения. Их появление совершенно логично, так как многим людям удобнее работать в привычном мессенджере. А в последние месяцы количество пользователей ChatGPT выросло многократно (и это ещё учебный год не начался).
Читать полностью »

Решение задачи определения RUL трансформаторов с помощью машинного обучения на python

2023-06-24 в 17:24, admin, рубрики: data science, machinelearning, python, Анализ и проектирование систем, диагностика, искусственный интеллект, машинное обучение, остаточный ресурс, промышленность

Дисклеймер:Читать полностью »

MusicGen — генерируем музыку на своём ПК. Новая локальная нейросеть — знакомство и установка

2023-06-11 в 3:06, admin, рубрики: audiocraft, MusicGen, гайд, генерация музыки, звук, инструкция, искусственный интеллект, композитор, машинное обучение, музыка, нейросеть, нейросеть локально

Facebook* на днях выкатил в свет новую нейронку - MusicGen (репозиторий).
Видимо, парням из компании было мало выпустить текстовую модель Llama, давшую огромный разгон развитию локальных нейросеток, и они решили сделать то же самое в сфере музыки.

Сегодня мы узнаем о модели чуть больше, подумаем о том, кому она нужна, и запустим её локально.

Читать полностью »

Хороший, плохой, злой и… свободный? Сравниваем глуповатые, но усердные AI-плагины для разработки

2023-06-08 в 14:08, admin, рубрики: AI, c++, Codeium, copilot, cybersecurity, FauxPilot, machine learning, ml, python, tabnine, безопасность, Блог компании «Лаборатория Касперского», ИИ, информационная безопасность, искусственный интеллект, кибербезопасность, машинное обучение, нейронные сети, нейросети, Программирование

Привет! Меня зовут Арсений, я — тимлид в команде разработки инструментов разработчика KasperskyOS. Работа нашей команды заключается в том, чтобы делать жизнь разработчика ПО под нашу собственную микроядерную OS удобной, так что любые технологии, упрощающие жизнь разработчика, не оставляют нас равнодушными. Вместе со всеми мы следим за хайпом вокруг нейросетей и решили сделать небольшой обзор AI-плагинов автодополнения кода, которые каждый из нас может использовать уже сейчас.

В этой заметке попробуем сравнить следующие AI плагины VSCode:

Copilot v1.84.61 — самый нашумевший робот
Tabnine v3.6.45 — самый старый из трех и самый дорогой
Codeium v1.2.11 — самый свежий и самый малоизвестный
FauxPilot — Open source, self-hosted аналог Copilot, использующий модели от CodeGen; посмотрим, что может противопоставить коммерческим продуктам OSS-проект, развернутый на моем запечном сервере.

Статья может быть полезна любому разработчику, пишущему на одном из мейнстримовых языков программирования. Также можно рассматривать ее как источник идей — как использовать этих пока глуповатых, но усердных роботов.

Читать полностью »

YandexGPT в Алисе: как мы создаём языковую модель нового поколения

2023-06-05 в 7:29, admin, рубрики: gpt, ml, yagpt, yalm, yalm 2.0, yandexgpt, алиса, Блог компании Яндекс, давай придумаем, искусственный интеллект, машинное обучение, поисковые технологии, яндекс

Обучение больших языковых моделей — это одно из самых актуальных направлений в машинном обучении. Крупнейшие IT-компании бьются над созданием всё более совершенных моделей. В том числе и Яндекс: мы создаём и применяем в наших сервисах нейросети YaLM уже больше двух лет.

В этом году улучшение моделей стало приоритетным на уровне всей компании. Внутри эта работа известна как проект «Генезис» или YaLM 2.0. Её результатом стал большой скачок в качестве наших моделей.

Новая модель получила название YandexGPT (YaGPT), вы могли впервые попробовать её в Алисе по запросу «Давай придумаем» чуть больше двух недель назад. Сегодня мы обновили YaGPT: Алиса научилась писать ответы с учётом истории предыдущих сообщений. В честь этого хотим рассказать Хабру историю всего проекта. Уже в ближайшее время новая модель станет частью и других сервисов Яндекса.

YandexGPT в Алисе: как мы создаём языковую модель нового поколения - 1

Читать полностью »

Реально ли привлечь РЖД за нарушение лицензии модели синтеза из репозитория silero-models?

2023-06-01 в 16:46, admin, рубрики: open source, голосовые интерфейсы, Законодательство в IT, конференции, лицензирование, машинное обучение, нарушение закона, ржд, транспорт, управление проектами

Увидел новость про виртуального помощника "Валеру", которого только что презентовала РЖД. Судя по голосу, взят наш голос aidar из репозитория silero-models … опубликованный под некоммерческой под лицензией CC BY-NC-SA.

Читать полностью »

Новые инструменты для работы c ML-моделями и обзор MLOps от CERN

2023-05-26 в 10:19, admin, рубрики: big data, data engineering, mlops, Блог компании Selectel, ит-инфраструктура, машинное обучение

Привет всем, кто работает с ML-моделями и занимается аналитикой данных! В новом дайджесте для вас много интересных обзоров по инструментам — как говорится, ни ClearML и Airflow едиными. Рынок решений стремительно развивается, и наши подборки помогут вам держать руку на пульсе. Еще больше полезных текстов по DataOps и MLOps публикуем в Telegram-сообществе «MLечный путь».

Как вам, кстати, ренессансная GPU на обложке, которую сгенерила нейросеть для блога Andreesen and Horowitz? Что тут сказать — просто поделитесь промтом.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «машинное обучение» - 15

YandexGPT в Браузере: как мы учили модель суммаризировать статьи

Кодеки новой эпохи: HEVC, AV1, VVC и нейросети

RuGPT3. Исследование вариантов циклическим перебором

Обзор бесплатных ботов ChatGPT в телеграме

Решение задачи определения RUL трансформаторов с помощью машинного обучения на python

MusicGen — генерируем музыку на своём ПК. Новая локальная нейросеть — знакомство и установка

Хороший, плохой, злой и… свободный? Сравниваем глуповатые, но усердные AI-плагины для разработки

YandexGPT в Алисе: как мы создаём языковую модель нового поколения

Реально ли привлечь РЖД за нарушение лицензии модели синтеза из репозитория silero-models?

Новые инструменты для работы c ML-моделями и обзор MLOps от CERN

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «машинное обучение» - 15

Новости

Актуальные темы

Архив