Рубрика «мультимодальные модели»

Задача Emotional FusionBrain 4.0: итоги и победители

2024-12-10 в 13:33, admin, рубрики: artificial intelligence, deeplearning, natural language processing, большие языковые модели, мультимодальные данные, мультимодальные модели, Сбер, соревнования, хакатон, Хакатоны

Всем привет! На связи снова лаборатория FusionBrain!

В сентябре мы анонсировали задачу Emotional FusionBrain 4.0, которая стала частью соревнования AI Journey Contest. Участникам предстояло разработать универсальную мультимодальную модель, которая учится понимать социальные взаимодействия людей по видео — другими словами, создать эмоциональный искусственный интеллект.

Теперь пришла пора подводить итоги!

Но начнём мы, конечно же, с описания задачи, чтобы уважаемые читатели оказались в едином контексте :)

Читать полностью »

Защита LLM в разработке чат-ботов в корпоративной среде: как избежать утечек данных и других угроз

2024-09-30 в 14:05, admin, рубрики: llm-attack, атаки, безопасность данных, большие языковые модели, искусственный интеллект, мультимодальные модели, нейросети, утечки

Читать полностью »

Эмоциональный и искусственный. Учим нейросети понимать социальные взаимодействия людей на AIJ Contest

2024-09-17 в 11:56, admin, рубрики: artificial intelligence, natural language processing, большие языковые модели, мультимодальные модели, соревнования, хакатон, Хакатоны

Мы в лаборатории Fusion Brain уже много лет работаем на созданием мультимодальных моделей, способных работать с как можно большим числом данных разного типа. Не так давно, например, мы релизнули мультимодальную LLM OmniFusion 1.1, способную поддерживать визуальный диалог и отвечать на вопросы по картинкам, причём с поддержкой русского языка — и рассказали об этом на Хабре.

Читать полностью »

«Пора ли гнать на мороз Computer Vision — scientist’ов ?» (Fondation Models и вокруг)

2024-01-18 в 0:50, admin, рубрики: CLIP, computer vision, dinov2, Fondation Models, I-Jepa, InternImages, InternVideo, машинное зрениее, мультимодальные модели, нейронные сети

Прошлый год в Computer Vision запомнился тем, что появилось множество больших претрейненных сетей (Fondation Models). Самая известная - GPT4v (ChatGPT с обработкой изображений).
В статье я попробую простым языком объяснить что это такое (для тех кто пропустил), как меняет индустрию. И когда можно будет выгнать на мороз лишних "ресерчеров".

Поговорим о следующем:

Что вообще такое "предтрейненные сети"
Где они используются?
Можно ли заменить ими обучение/разработчиков?
Какие есть ограничения?
Что будет дальше?

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «мультимодальные модели»

Задача Emotional FusionBrain 4.0: итоги и победители

Защита LLM в разработке чат-ботов в корпоративной среде: как избежать утечек данных и других угроз

Эмоциональный и искусственный. Учим нейросети понимать социальные взаимодействия людей на AIJ Contest

«Пора ли гнать на мороз Computer Vision — scientist’ов ?» (Fondation Models и вокруг)

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «мультимодальные модели»

Задача Emotional FusionBrain 4.0: итоги и победители

Защита LLM в разработке чат-ботов в корпоративной среде: как избежать утечек данных и других угроз

Эмоциональный и искусственный. Учим нейросети понимать социальные взаимодействия людей на AIJ Contest

«Пора ли гнать на мороз Computer Vision — scientist’ов ?» (Fondation Models и вокруг)

Новости

Актуальные темы

Архив