Рубрика «мультимодальные модели»
Защита LLM в разработке чат-ботов в корпоративной среде: как избежать утечек данных и других угроз
2024-09-30 в 14:05, admin, рубрики: llm-attack, атаки, безопасность данных, большие языковые модели, искусственный интеллект, мультимодальные модели, нейросети, утечкиЭмоциональный и искусственный. Учим нейросети понимать социальные взаимодействия людей на AIJ Contest
2024-09-17 в 11:56, admin, рубрики: artificial intelligence, natural language processing, большие языковые модели, мультимодальные модели, соревнования, хакатон, ХакатоныМы в лаборатории Fusion Brain уже много лет работаем на созданием мультимодальных моделей, способных работать с как можно большим числом данных разного типа. Не так давно, например, мы релизнули мультимодальную LLM OmniFusion 1.1, способную поддерживать визуальный диалог и отвечать на вопросы по картинкам, причём с поддержкой русского языка — и рассказали об этом на Хабре.
«Пора ли гнать на мороз Computer Vision — scientist’ов ?» (Fondation Models и вокруг)
2024-01-18 в 0:50, admin, рубрики: CLIP, computer vision, dinov2, Fondation Models, I-Jepa, InternImages, InternVideo, машинное зрениее, мультимодальные модели, нейронные сетиПрошлый год в Computer Vision запомнился тем, что появилось множество больших претрейненных сетей (Fondation Models). Самая известная - GPT4v (ChatGPT с обработкой изображений).
В статье я попробую простым языком объяснить что это такое (для тех кто пропустил), как меняет индустрию. И когда можно будет выгнать на мороз лишних "ресерчеров".
Поговорим о следующем:
-
Что вообще такое "предтрейненные сети"
-
Где они используются?
-
Можно ли заменить ими обучение/разработчиков?
-
Какие есть ограничения?
-
Что будет дальше?