Сегодня поделюсь с Хабром не столько новостью, сколько нашим опытом и советами из области дообучения моделей и промпт-инжиниринга. Расскажу, через что пришлось пройти нашей команде, чтобы модель начала делать то, что от неё ожидают.
Рубрика «машинное обучение» - 15
YandexGPT в Браузере: как мы учили модель суммаризировать статьи
2023-07-06 в 7:58, admin, рубрики: yandexgpt, Блог компании Яндекс, браузеры, искусственный интеллект, команда яндекс.браузера, краткий пересказ, машинное обучение, суммаризация, яндексКодеки новой эпохи: HEVC, AV1, VVC и нейросети
2023-07-03 в 9:00, admin, рубрики: AV1, avc, CAE, content-aware encoding, H.264, H.265, Harmonic, HEVC, netflix, ruvds_статьи, VVC, WaveOne, Алгоритмы, Блог компании RUVDS.com, ИИ-кодеки, кодеки, машинное обучение, машинное обучение кодеков, нейронное улучшение, Работа с видео, сжатие данных, сжатие с учетом контентаХотя новые стандарты кодеков появляются каждые десять лет, все они основаны на пиксельной математике — манипулировании значениями отдельных пикселей в видеокадре для удаления информации, не важной для восприятия. Другие математические операции уменьшают объём данных после первоначального кодирования.
В новом поколении кодеков алгоритмы машинного обучения используются для анализа и понимания визуального содержания видео, выявления избыточных данных и более эффективного сжатия. Вместо написанных вручную алгоритмов, тут применяют методы Software 2.0, основанные на обучении. Данная область развивается на протяжении десятилетий, но в последние годы получила сильный толчок. Все знают, что в 2017 году произошёл прорыв в разработке ИИ благодаря изобретению трансформеров. В свою очередь, они основаны на концепции внимания, которую придумали в 90-е. Эта техника впервые позволила соотносить друг с другом отдельные части текста или видеокадра.
Читать полностью »
RuGPT3. Исследование вариантов циклическим перебором
2023-07-02 в 5:32, admin, рубрики: deep learning, gpt, machine learning, natural language processing, nlp, rugpt3, генеративные модели, искусственные нейронные сети, искусственный интеллект, машинное обучение, обработка естественного языка, языковые моделиRuGPT3 - коллекция генеративных моделей от Сбер
Проводим автоматическое тестирование циклическим перебором вариантов
Работаем в Colab, тестируем Small, Mediub, Large.
Параметры генерации совершенно неоптимизированы - это первый заход, чтобы посмотреть исходную ситуацию и сравнивать по мере улучшения.
Читать полностью »
Обзор бесплатных ботов ChatGPT в телеграме
2023-06-25 в 11:07, admin, рубрики: Bothub, chatgpt, Google, GShard, Midjorney, OpenAI, XLA, искусственный интеллект, машинное обучение, мессенджеры, СофтНедавно мы писали про бесплатные фронтенды к ChatGPT, созданные главным образом по причине блокировки ОpenAI в РФ. Но технологии не стоят на месте — и сейчас уже в ходу телеграм-боты того же предназначения. Их появление совершенно логично, так как многим людям удобнее работать в привычном мессенджере. А в последние месяцы количество пользователей ChatGPT выросло многократно (и это ещё учебный год не начался).
Читать полностью »
Решение задачи определения RUL трансформаторов с помощью машинного обучения на python
2023-06-24 в 17:24, admin, рубрики: data science, machinelearning, python, Анализ и проектирование систем, диагностика, искусственный интеллект, машинное обучение, остаточный ресурс, промышленностьДисклеймер:Читать полностью »
MusicGen — генерируем музыку на своём ПК. Новая локальная нейросеть — знакомство и установка
2023-06-11 в 3:06, admin, рубрики: audiocraft, MusicGen, гайд, генерация музыки, звук, инструкция, искусственный интеллект, композитор, машинное обучение, музыка, нейросеть, нейросеть локальноFacebook* на днях выкатил в свет новую нейронку - MusicGen (репозиторий).
Видимо, парням из компании было мало выпустить текстовую модель Llama, давшую огромный разгон развитию локальных нейросеток, и они решили сделать то же самое в сфере музыки.
Сегодня мы узнаем о модели чуть больше, подумаем о том, кому она нужна, и запустим её локально.
Хороший, плохой, злой и… свободный? Сравниваем глуповатые, но усердные AI-плагины для разработки
2023-06-08 в 14:08, admin, рубрики: AI, c++, Codeium, copilot, cybersecurity, FauxPilot, machine learning, ml, python, tabnine, безопасность, Блог компании «Лаборатория Касперского», ИИ, информационная безопасность, искусственный интеллект, кибербезопасность, машинное обучение, нейронные сети, нейросети, ПрограммированиеПривет! Меня зовут Арсений, я — тимлид в команде разработки инструментов разработчика KasperskyOS. Работа нашей команды заключается в том, чтобы делать жизнь разработчика ПО под нашу собственную микроядерную OS удобной, так что любые технологии, упрощающие жизнь разработчика, не оставляют нас равнодушными. Вместе со всеми мы следим за хайпом вокруг нейросетей и решили сделать небольшой обзор AI-плагинов автодополнения кода, которые каждый из нас может использовать уже сейчас.
В этой заметке попробуем сравнить следующие AI плагины VSCode:
- Copilot v1.84.61 — самый нашумевший робот
- Tabnine v3.6.45 — самый старый из трех и самый дорогой
- Codeium v1.2.11 — самый свежий и самый малоизвестный
- FauxPilot — Open source, self-hosted аналог Copilot, использующий модели от CodeGen; посмотрим, что может противопоставить коммерческим продуктам OSS-проект, развернутый на моем запечном сервере.
Статья может быть полезна любому разработчику, пишущему на одном из мейнстримовых языков программирования. Также можно рассматривать ее как источник идей — как использовать этих пока глуповатых, но усердных роботов.
YandexGPT в Алисе: как мы создаём языковую модель нового поколения
2023-06-05 в 7:29, admin, рубрики: gpt, ml, yagpt, yalm, yalm 2.0, yandexgpt, алиса, Блог компании Яндекс, давай придумаем, искусственный интеллект, машинное обучение, поисковые технологии, яндексОбучение больших языковых моделей — это одно из самых актуальных направлений в машинном обучении. Крупнейшие IT-компании бьются над созданием всё более совершенных моделей. В том числе и Яндекс: мы создаём и применяем в наших сервисах нейросети YaLM уже больше двух лет.
В этом году улучшение моделей стало приоритетным на уровне всей компании. Внутри эта работа известна как проект «Генезис» или YaLM 2.0. Её результатом стал большой скачок в качестве наших моделей.
Новая модель получила название YandexGPT (YaGPT), вы могли впервые попробовать её в Алисе по запросу «Давай придумаем» чуть больше двух недель назад. Сегодня мы обновили YaGPT: Алиса научилась писать ответы с учётом истории предыдущих сообщений. В честь этого хотим рассказать Хабру историю всего проекта. Уже в ближайшее время новая модель станет частью и других сервисов Яндекса.
Реально ли привлечь РЖД за нарушение лицензии модели синтеза из репозитория silero-models?
2023-06-01 в 16:46, admin, рубрики: open source, голосовые интерфейсы, Законодательство в IT, конференции, лицензирование, машинное обучение, нарушение закона, ржд, транспорт, управление проектамиУвидел новость про виртуального помощника "Валеру", которого только что презентовала РЖД. Судя по голосу, взят наш голос aidar
из репозитория silero-models
… опубликованный под некоммерческой под лицензией CC BY-NC-SA.
Новые инструменты для работы c ML-моделями и обзор MLOps от CERN
2023-05-26 в 10:19, admin, рубрики: big data, data engineering, mlops, Блог компании Selectel, ит-инфраструктура, машинное обучениеПривет всем, кто работает с ML-моделями и занимается аналитикой данных! В новом дайджесте для вас много интересных обзоров по инструментам — как говорится, ни ClearML и Airflow едиными. Рынок решений стремительно развивается, и наши подборки помогут вам держать руку на пульсе. Еще больше полезных текстов по DataOps и MLOps публикуем в Telegram-сообществе «MLечный путь».
Как вам, кстати, ренессансная GPU на обложке, которую сгенерила нейросеть для блога Andreesen and Horowitz? Что тут сказать — просто поделитесь промтом.
Читать полностью »