Мы разработали, собрали и интегрировали в операционные процессы складов Ozon устройства для измерения габаритов и веса товаров. Об этом мы писали ранее. Но к идее создания своего решения пришли не сразу.
Рубрика «computer vision» - 2
Размер имеет значение. Как Ozon автоматизировал измерение товаров на складах
2024-04-23 в 14:11, admin, рубрики: computer vision, CV, machine learning, ml, ozon tech, Компьютерное зрениеГенеративные 3D-модели
2024-04-19 в 9:08, admin, рубрики: 3d, computer vision, ml, генеративные моделиВведение
Салют! На связи Игорь Пасечник — технический лид направления XR RnD SberDevices. Сегодня я хочу рассказать про одно из наших направлений исследований — разработку генеративных моделей для 3D-контента.
Как мы оцифровали футбольные матчи с помощью CV
2024-02-27 в 7:09, admin, рубрики: computer vision, sportech, Алгоритмы, анализ данных, обработка видео, спорт, стриминг, яндексПривет! Меня зовут Владимир Цуканов, я СТО спортивного направления в Яндекс Плюсе. Мы занимаемся съёмкой, обработкой и стримингом спортивных событий. В этом посте я расскажу о работе с технической съёмкой и анализом футбольных матчей.
«Пора ли гнать на мороз Computer Vision — scientist’ов ?» (Fondation Models и вокруг)
2024-01-18 в 0:50, admin, рубрики: CLIP, computer vision, dinov2, Fondation Models, I-Jepa, InternImages, InternVideo, машинное зрениее, мультимодальные модели, нейронные сетиПрошлый год в Computer Vision запомнился тем, что появилось множество больших претрейненных сетей (Fondation Models). Самая известная - GPT4v (ChatGPT с обработкой изображений).
В статье я попробую простым языком объяснить что это такое (для тех кто пропустил), как меняет индустрию. И когда можно будет выгнать на мороз лишних "ресерчеров".
Поговорим о следующем:
-
Что вообще такое "предтрейненные сети"
-
Где они используются?
-
Можно ли заменить ими обучение/разработчиков?
-
Какие есть ограничения?
-
Что будет дальше?
Как ИИ работает даже в зоне взрывных работ
2023-03-09 в 7:32, admin, рубрики: computer vision, Блог компании Группа НЛМК, добыча руды, машинное зрение, машинное обучение, производство, рудаЧтобы добыть железную руду, породу в карьере нужно рызрыхлить. В карьере СГОКа (Стойленского горно-обогатительного комбината) делается это с помощью буровзрывных работ. Полученную после взрыва горную массу нужно погрузить в карьерный самосвал, а потом в вагон-думпкар и отправить на обогатительную фабрику.
Распознавание поднятых пальцев на Python+OpenCV
2022-08-06 в 8:00, admin, рубрики: computer vision, finger, gesture control, github, opencv, python, будущее здесь, Компьютерное зрение, пальцы, Программирование, управление жестамиВ данной статье хочу рассмотреть банальный и несложный проект, а именно подсчет количества поднятых пальцев.
Все исходники можно найти на моем Github.
Код будем рассматривать с самого начала, но лучше всего ознакомиться с моими предыдущими статьями.
Подготавливаем среду и устанавливаем следующие библиотеки:
pip install mediapipe
pip install opencv-python
pip install math
Создаем файл HandTrackingModule.py
с привычным для моих читателей классом handDetector
:
Читать полностью »
Разбираемся с устройством свёрток на примере объединения двух свёрток в одну в pytorch
2022-06-12 в 15:09, admin, рубрики: computer vision, convolution, deep learning, python, pytorch, математика, машинное обучениеНеинтересная цель этой статьи — показать, как можно смержить две свертки пайторча в одну. Если интересна лишь реализация — прошу в конец статьи.
А интересная цель — потыкать непосредственно в веса моделей на примере объединения свёрток. Узнать, как они хранятся и используются конкретно в pytorch, не вдаваясь в хардкорные интересности по типу im2col.
Но перед тем, как показывать реализацию, давайте немного вспомним, с чем работаем.
Визуальный SLAM: делаем HD-карты при помощи смартфона
2022-03-02 в 9:35, admin, рубрики: computer vision, Direct-SLAM, g2o, HD-maps, machine learning, ORB-SLAM, SLAM, Блог компании Город Иннополис, машинное зрение, машинное обучение, обработка изображений, Разработка робототехникиПривет! Меня зовут Александр Гращенков, я iOS-разработчик в компании RoadAR. С 2016 года живу и работаю в Иннополисе, занимаюсь компьютерным зрением и интеграцией нейросетей в мобильные платформы.
Проблемы современного машинного обучения
2022-02-14 в 10:30, admin, рубрики: artificial intelligence, computer vision, natural language processing, natural language understanding, Блог компании Open Data Science, искусственный интеллект, машинное обучение, Научно-популярноеВо многих популярных курсах машинного и глубокого обучения вас научат классифицировать собак и кошек, предсказывать цены на недвижимость, покажут еще десятки задач, в которых машинное обучение, вроде как, отлично работает. Но вам расскажут намного меньше (или вообще ничего) о тех случаях, когда ML-модели не работают так, как ожидалось.
Частой проблемой в машинном обучении является неспособность ML-моделей корректно работать на большем разнообразии примеров, чем те, что встречались при обучении. Здесь идет речь не просто о других примерах (например, тестовых), а о других типахЧитать полностью »
Векторное представление товаров Prod2Vec: как мы улучшили матчинг и избавились от кучи эмбеддингов
2022-01-28 в 7:59, admin, рубрики: computer vision, data mining, deep learning, machine learning, natural language processing, nlp (natural language processing), ozon tech, Блог компании Ozon Tech, машинное обучение, обработка изображенийНа странице любого товара на Ozon есть картинки, заголовок, описание и дополнительные атрибуты. Всю эту информацию мы хотим извлекать и обрабатывать для решения разных задач. И особенно она важна для команды матчинга.
Чтобы извлекать признаки из товара, мы строим его векторные представления (эмбеддинги), используя различные текстовые модели (fastText, трансформеры) для описаний и заголовков и целый набор архитектур свёрточных сетей (ResNet, Effnet, NFNet) — для картинок. Далее эти векторы используются для генерации фичей и товарного сопоставления.
На Ozon ежедневно появляются миллионы обновлений — и считать эмбеддинги для всех моделей становится проблематично. А что, если вместо этого (где каждый вектор описывает отдельную часть товара) мы получим один вектор для всего товара сразу? Звучит неплохо, только как бы это грамотно реализовать…