Рубрика «computer vision» - 2
VLM в Нейро: как мы создавали мультимодальную нейросеть для поиска по картинкам
2024-10-03 в 9:00, admin, рубрики: computer vision, llm, vlm, нейросети, поисковые системы, яндексВместо тысячи слов: как картинки помогают в текстовом Поиске?
2024-09-17 в 11:17, admin, рубрики: CLIP, computer vision, CV, nlp, Okko, обложки, онлайн кинотеатр, поиск, поисковые алгоритмы, фильмы
Всем привет! Меня зовут Дима. Я работаю в Поиске Okko и в этой статье хочу рассказать, насколько картиночные модели полезны для задачи Поиска и для чего мы используем их в наших пайплайнах.
Sapiens: фундаментальная CV-модель для задач с людьми
2024-09-05 в 9:28, admin, рубрики: AI, computer vision, CV, data mining, open source, ИИ, Компьютерное зрение, разметка, разметка данных, разметка изображенийПочти две недели назад из недр одной из самых прорывных AI лабораторий мира вышла новая классная модель (а точнее — семейство моделей) компьютерного зрения, но данная новость в русскоязычном интернете прошла будто бы без энтузиазма. А зря — штука довольно хороша.
Итак, у нас есть семейство моделей, которое из коробки поможет решить «четыре фундаментальные задачи человека в CV» (цитата авторов) и давайте посмотрим, что же там есть есть и как это работает.
You Only Look Once… But it Sees Everything! Обзор YOLO детекторов. Часть 1
2024-08-15 в 12:22, admin, рубрики: bounding box, computer vision, data science, detection, yolo, you only look once, детекцияМы умеем заменять мебель на фото, а чего добились вы? Начинаем автоген-челлендж
2024-08-15 в 6:43, admin, рубрики: AI, computer vision, deep learning, machine learning, автоген-челленджГенерация разнообразного контента с помощью ИИ продолжает быть на пике популярности. На смену картинкам по описанию пришли музыкальные композиции на основе текста и психоделические видео, на которых у людей меняется не только геометрия, но и вообще всё. Однако это лишь вершина айсберга. We need to go deeper. Хабру нужны не смешные нейро(де)генеративные мемы, а статьи от людей, которые работают с генеративным ИИ профессионально и на острие современных технологий пытаются сделать нечто крутое и полезное.
Размер имеет значение. Как Ozon автоматизировал измерение товаров на складах
2024-04-23 в 14:11, admin, рубрики: computer vision, CV, machine learning, ml, ozon tech, Компьютерное зрениеМы разработали, собрали и интегрировали в операционные процессы складов Ozon устройства для измерения габаритов и веса товаров. Об этом мы писали ранее. Но к идее создания своего решения пришли не сразу.

Как мы пришли к идее создания решения
Генеративные 3D-модели
2024-04-19 в 9:08, admin, рубрики: 3d, computer vision, ml, генеративные модели
Введение
Салют! На связи Игорь Пасечник — технический лид направления XR RnD SberDevices. Сегодня я хочу рассказать про одно из наших направлений исследований — разработку генеративных моделей для 3D-контента.
Как мы оцифровали футбольные матчи с помощью CV
2024-02-27 в 7:09, admin, рубрики: computer vision, sportech, Алгоритмы, анализ данных, обработка видео, спорт, стриминг, яндекс
Привет! Меня зовут Владимир Цуканов, я СТО спортивного направления в Яндекс Плюсе. Мы занимаемся съёмкой, обработкой и стримингом спортивных событий. В этом посте я расскажу о работе с технической съёмкой и анализом футбольных матчей.
«Пора ли гнать на мороз Computer Vision — scientist’ов ?» (Fondation Models и вокруг)
2024-01-18 в 0:50, admin, рубрики: CLIP, computer vision, dinov2, Fondation Models, I-Jepa, InternImages, InternVideo, машинное зрениее, мультимодальные модели, нейронные сетиПрошлый год в Computer Vision запомнился тем, что появилось множество больших претрейненных сетей (Fondation Models). Самая известная - GPT4v (ChatGPT с обработкой изображений).
В статье я попробую простым языком объяснить что это такое (для тех кто пропустил), как меняет индустрию. И когда можно будет выгнать на мороз лишних "ресерчеров".
Поговорим о следующем:
-
Что вообще такое "предтрейненные сети"
-
Где они используются?
-
Можно ли заменить ими обучение/разработчиков?
-
Какие есть ограничения?
-
Что будет дальше?