Стоит признать, мы таки живем в эпоху киберпанка. Он не похож (пока) на мрачные миры Ридли Скотта и братьев Вачовски, но вполне отвечает меткому определению: high tech, low lifeЧитать полностью »
Рубрика «Компьютерное зрение» - 3
Взгляд компьютерным зрением на работу коммунальных служб
2023-02-20 в 13:01, admin, рубрики: opencv, анализ изображений, визуализация данных, инженерные системы, Компьютерное зрение, машинное обучение, обработка изображений, Работа с видеоКогда картинка дороже слов
2023-01-02 в 13:00, admin, рубрики: airbnb, ruvds_перевод, анализ изображений, Блог компании RUVDS.com, искусственный интеллект, Компьютерное зрение, машинное обучение, нейронные сети, обработка изображений, свёрточная нейросетьВладельцы жилья оставляют на сайте Airbnb уникальные предложения аренды по всему миру. На Airbnb есть сотни миллионов сопутствующих фотографий. Фотографии содержат важную информацию о стиле и дизайне, которую сложно передать словами или списком. Поэтому несколько команд сотрудников Airbnb сегодня используют компьютерное зрение (computer vision), чтобы извлекать сведения об удобствах из нашего богатого массива данных, чтобы помогать гостям в удобном поиске предложений, соответствующих их предпочтениям.
В предыдущих постах WIDeText: A Multimodal Deep Learning Framework, Categorizing Listing Photos at Airbnb и Amenity Detection and Beyond — New Frontiers of Computer Vision at Airbnb мы рассказали о том, как используем компьютерное зрение для категоризации помещений и выявления удобств, чтобы сопоставлять фотографии предложений с таксономией дискретных концепций. В этом посте мы расскажем о том, как Airbnb использует эстетику и эмбеддинги изображений для оптимизации различных поверхностей продукта, включая содержимое рекламных объявлений, презентации и рекомендаций позиций.Читать полностью »
QR-code. Обнаружить и расшифровать. Шаг 1 — Обнаружить
2023-01-01 в 15:44, admin, рубрики: CV, opencv, python, Компьютерное зрениеВведение
Эта статья - первая в цикле статей, в котором мы разберемся с тем, как qr-код устроен, и напишем простенький Qr-детектор и дешифровщик, а также свой собственный генератор qr-кодов.
Использовать мы будем python вместе с opencv и numpy. Учитывая, что opencv - кросс-язычная библиотека, а также то, что работа с изображением/текстурой в разных решениях выглядят примерно одинаково, то я думаю, что вы без труда сможете перевести алгоритм, который будет здесь написан, на любой нужный вам язык
В первую очередь мы будем рассматривать полноразмерный qr-код, Micro-qr возможно будет рассмотрен после завершения работы над полноразмерным qr
Распознавание поднятых пальцев на Python+OpenCV
2022-08-06 в 8:00, admin, рубрики: computer vision, finger, gesture control, github, opencv, python, будущее здесь, Компьютерное зрение, пальцы, Программирование, управление жестамиВ данной статье хочу рассмотреть банальный и несложный проект, а именно подсчет количества поднятых пальцев.
Все исходники можно найти на моем Github.
Код будем рассматривать с самого начала, но лучше всего ознакомиться с моими предыдущими статьями.
Подготавливаем среду и устанавливаем следующие библиотеки:
pip install mediapipe
pip install opencv-python
pip install math
Создаем файл HandTrackingModule.py
с привычным для моих читателей классом handDetector
:
Читать полностью »
Уроки компьютерного зрения на Python + OpenCV с самых азов. Часть 4
2022-03-19 в 16:36, admin, рубрики: opencv, python, Компьютерное зрениеНа прошлом уроке мы познакомились с медианной фильтрацией, кастомными фильтрами и выделением контуров. Напомню, что выделенный контур можно использовать для поиска области интересов на изображении и для нахождения различных фич. В частности, вот что можно далее сделать с контуром:
-
Выявить различные геометрические примитивы (прямые, окружности).
-
Превратить в цепочки точек и уже их отдельно анализировать.
-
Описать как граф и применять к нему алгоритмы на графах.
Продолжим изучать методы предобработки. Например, изображением можно сделать контрастным:
Читать полностью »
Язык программирования Ficus для вычислений и не только
2021-12-02 в 21:23, admin, рубрики: c++, ficus, opencv, искусственный интеллект, Компиляторы, Компьютерное зрение, функциональное программирование, языки программирования"Наш путь извилист, но перспективы светлые" Мао Цзедун
Здравствуйте, уважаемыее. Меня зовут Вадим Писаревский, я являлся лидером OpenCV (Open Source Computer Vision Library) на протяжении примерно 20 лет, и продолжаю участие в этом замечательном проекте. В этой статье я рад представить вашему вниманию результат другого своего проекта, над которым в фоне работаю уже много лет, а последние пару лет как минимум половину своего рабочего времени.
Краткая информация о языке
Чем рука робота лучше вашей, или Автоматизация контроля качества на производстве
2021-09-07 в 7:01, admin, рубрики: computer vision, data science, deep learning, image recognition, machine learning, Анализ и проектирование систем, Блог компании ГК ЛАНИТ, Компьютерное зрение, Ланит, машинное обучение, норбитЗакройте глаза и представьте себя в цехах большого завода. Пусть это будет производство вакцин в ампулах. А вы, как и еще 70 человек, заняты тем, что целыми днями просматриваете ампулы, чтобы отобрать дефектные. И так весь день… Сколько ампул с малейшими отклонениями от нормы вы бы не заметили? Задачу усложняет то, что дефектом считается не только неправильная запайка, но и едва заметная точка на дне ампулы. Можете ли вы быть на 100% уверены, что не пропустили ни одного дефекта? А ведь вас еще будут выборочно перепроверять.
Устают глаза, притупляется внимание.
«Я не робот»: история Яндекса о том, как победить ботов, а не людей
2021-04-06 в 8:01, admin, рубрики: антифрод, Блог компании Яндекс, информационная безопасность, капча, капча яндекса, команда яндекс.поиска, Компьютерное зрение, обработка изображений, Разработка веб-сайтов, яндексНикто не любит капчу. Угадай слово по плохой картинке, собери пазл, отличи светофор от гидранта, сложи два числа и так далее. Формы бывают разные, но суть всегда одна: мы тратим своё время и нервы.
Чуть больше года назад моя команда взялась за модернизацию старой капчи Яндекса. Обычно в таких задачах стремятся повысить качество и полноту отсева ботов, оставив человеку шанс прорваться через капчу. Но мы зашли с другой стороны: решили сделать капчу более дружелюбной к людям, не ухудшив при этом защиту от ботов. Казалось бы, наивный подход. Но у нас получилось.
Как построить свою систему поиска похожих изображений
2021-04-04 в 10:49, admin, рубрики: deep learning, image retrieval, machine learning, глубокое обучение, искусственный интеллект, Компьютерное зрение, машинное обучение, нейронные сети, обработка изображений, поиск дубликатов изображений, поиск похожих изображений, поисковые технологииПредставлюсь
Всем привет! Меня зовут Влад Виноградов, я руководитель отдела компьютерного зрения в компании EORA.AI. Мы занимаемся глубоким обучением уже более трех лет и за это время реализовали множество проектов для российских и международных клиентов в которые входила исследовательская часть и обучение моделей. В последнее время мы фокусируемся на решении задач поиска похожих изображений и на текущий момент создали системы поиска по логотипам, чертежам, мебели, одежде и другим товарам.
Эта публикация предназначена для Machine Learning инженеров и написана по мотивам моего выступления Читать полностью »
Scaled YOLO v4 самая лучшая нейронная сеть для обнаружения объектов на датасете MS COCO
2020-12-07 в 16:05, admin, рубрики: AI, artificial intelligence, computer vision, deep learning, neural network, object detection, real-time object detection, yolo, YOLOv4, искусственный интеллект, Компьютерное зрение, машинное обучение, нейронные сети, обнаружение объектов, обработка изображений, Программирование- Научная статья
- Pytorch: YOLOv4-CSP, YOLOv4-P5, YOLOv4-P6, YOLOv4-P7 (main repository — use to reproduce results)
YOLOv4-CSP
YOLOv4-tiny
YOLOv4-large - Darknet: YOLOv4-tiny, YOLOv4-CSP, YOLOv4x-MISH
- Структура YOLOv4-CSP
Scaled YOLO v4 является самой точной нейронной сетью (55.8% AP) на датасете Microsoft COCO среди всех опубликованных нейронных сетей на данный момент. А также является лучшей с точки зрения соотношения скорости к точности во всем диапазоне точности и скорости от 15 FPS до 1774 FPS. На данный момент это Top1 нейронная сеть для обнаружения объектов.
Scaled YOLO v4 обгоняет по точности нейронные сети:
- Google EfficientDet D7x / DetectoRS or SpineNet-190 (self-trained on extra-data)
- Amazon Cascade-RCNN ResNest200
- Microsoft RepPoints v2
- Facebook RetinaNet SpineNet-190
Мы показываем, что подходы YOLO и Cross-Stage-Partial (CSP) Network являются лучшими с точки зрения, как абсолютной точности, так и соотношения точности к скорости.
График Точности (вертикальная ось) и Задержки (горизонтальная ось) на GPU Tesla V100 (Volta) при batch=1 без использования TensorRT: