Рубрика «Компьютерное зрение»

Когда-то дроны казались фантастикой, но сегодня они становятся незаменимыми помощниками на производстве. В СИБУРе это уже реальность: с 2021 года мы не просто тестировали технологии, а построили полноценный дрон-сервис, который экономит миллионы рублей и сотни часов работы. Heavy digital во всей красе!

Хотите узнать, как из трёх дронов вырос целый парк из более чем 20 машин, а мониторинг трубопроводов перестал зависеть от человеческого фактора? Тогда давайте разбираться. А рассказывать об этом буду я — Андрей Лантрат, руководитель проекта.

Читать полностью »

Зачем вообще сравнивать медиаконтент?

Каждый день миллионы изображений, видео и аудиофайлов загружаются в интернет. Мы смотрим фильмы, слушаем музыку, листаем соцсети, даже не задумываясь о том, какие алгоритмы стоят за тем, чтобы контент отображался корректно и не повторялся. Но что, если вам нужно сравнивать медиаконтент автоматически? Как понять, одинаковые ли две фотографии, если одна немного темнее? Как сравнить два видео, если они сняты под разными углами? А что делать, если вам нужно найти дубликат аудиофайла, но на одной записи есть шум?

Читать полностью »

Всем привет, меня зовут Евгений Мунин. Я Senior ML Engineer в Ad Tech в платформе ставок для рекламы и автор ТГ канала ML Advertising. В данной статье мы поговорим об одном из способов повышения узнаваемости брендов в спорте, а точнее виртуальной рекламе. Разберем размещение рекламных баннеров на видео и напишем пример на Python и OpenCV, где разместим логотип Adidas с использованием алгоритма детектирования ключевых точек SIFT и гомографии для искажения баннера под перспективу.

Форматы рекламы в спортивных трансляциях

Читать полностью »

ИИ – это очень здорово и удобно. Он уже спасает жизни, штрафует за преступления, помогает делать весёлые картинки и видеоролики (посмотрите только на рекламу Сбера к 8 марта). Однако, за искусственным интеллектом нужен глаз да глаз, потому что он иногда выдаёт такие штуки, что становится стыдно или страшно.

Предлагаю рассмотреть несколько примеров – про оштрафованного адвоката, запутанного Евгения Онегина, про робота, склоняющего пациента к роскомнадзору, сексизм при отборе кандидатов на работу и другие. 

А в комментарии присылайте самые яркие и бредовые случаи – чтобы мы собрали полный список. 

Читать полностью »

Тема компьютерного зрения достаточно обширна: в ней рассматриваются различные способы распознавания статичных изображений и видео. Однако многие из предлагаемых в интернете решений требуют повышенных вычислительных мощностей, сложного ПО и специального оборудования.

В этой статье мы не будем рассматривать что‑то сложное, а вместо этого разберём создание простого сервера для распознавания изображений на Python.

Выбор языка Python для работы с OCR не случаен. Этот язык поддерживает множество библиотек и фреймворков, некоторые из которых мы будем использовать для создания нашего сервера.

Начинаем установкуЧитать полностью »

Приветствую всех читающих!

Меня зовут Антон Антонов, я инженер по искусственному интеллекту, работаю в Институте искусственного интеллекта AIRI в команде, которая занимается Embodied AI — областью, связывающей робототехнику, компьютерное зрение и большие языковые модели.

Недавно наша группа получила приятное известие: нашу статью с описанием модели того, как люди кликают и тапают на картинки, приняли на грядущий NeurIPS! Она будет полезна, чтобы тестировать модели интерактивной сегментации, которые помогают автоматизировать и ускорить процесс разметки изображений человеком.Читать полностью »

YOLO расшифровывается как You Only Look Once. Это широко известная архитектура компьютерного зрения, которая знаменита в том числе своим огромным количеством версий: первая из них вышла в 2016 году и решала только задачу детекции объектов на изображении, а последняя – одиннадцатая – появилась в сентябре этого года и уже представляет из себя целую фундаментальную модель, которую можно использовать для классификации, трекинга объектов на видео, задач pose estimation и тд. Все это – в реальном времени.

Читать полностью »

Дилеммы, с которыми вы столкнетесь при разработке биометрических датасетов - 1

Если вы хотите научить модель машинного зрения разбираться в сортах кукурузы или, скажем, отличать пешеходов от автомобилейЧитать полностью »

VR для животных: приключения журчалки и краба в виртуальной реальности - 1

Развитие науки и технологий начитается в лабораториях и являются результатом непосильного труда ученых умов из самых разных отраслей науки. В последствии изобретения становятся либо постоянными жильцами лабораторий и используются для дальнейших исследований, либо становятся достоянием общественности, облегчая наш быт и досуг. Но иногда эти технологии возвращаются в лаборатории для весьма необычных тестов. Ученые из Университета Флиндерса (Австралия) решили использовать технологию виртуальной реальности на мелких животных, дабы лучше понять их поведение. Как ученые адаптировали VR под маленьких подопытных, какие параметры были изучены, и что нового удалось узнать? Ответы на эти вопросы мы найдем в докладе ученых.Читать полностью »

Хочу поделиться своим опытом разработки программного обеспечения для робота-манипулятора, которого мы научили распознавать разные объекты на основе их CAD-моделей. В этой статье я подробно рассмотрю процесс создания такого ПО на примере недавнего проекта, связанного с производством мебели. С помощью внедрения технологии распознавания геометрии панелей ДСП мы обучили промышленного робота-манипулятора подавать панели требуемым торцом на станок для дальнейшей обработки. Это значительно повысило производительность линии и облегчило жизнь работникам производства.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js