Рубрика «computer vision» - 2

Это продолжение статьи “Rope-Ladder Tracker: визуальный возврат без GPS” , где я представил концепцию структурированного позиционирования по принципу “верёвочной лестницы”. Тогда это была идея, прототип и первые кадры. Сегодня — полноценная, стабильная система, готовая к интеграции в реальный дрон.

Что изменилось за это время?

Первая версия rope-ladder-tracker работала, но была хрупкой:

  • Чувствительна к освещению.

  • Сыровато обрабатывала потерю точек.

  • Не учитывала смену состояния трекинга.

  • Могла “зависнуть” при плохом кадре.

  • Читать полностью »

Удивительно, но факт: несколько изменений в изображении может полностью изменить вывод нейросети, что ломает заложенную разработчиком логику. В данной статье мы не просто подсветим факт существования One Pixel атаки, но и комплексно разберём архитектурные факторы, которые влияют на устойчивость CV-систем к данному семейству атак.

Читать полностью »

1. Вводная

Это мой первый опыт написания статьи. Судим, но не строго.

Недавно завершил интересный пэт-проект. Настолько интересный, что захотелось поделиться.

Это десктопная программа, которая:

  • Считывает скрин игрового стола в покере.

  • С помощью компьютерного зрения извлекает расклад, ставки и карты.

  • Рассчитывает ожидаемую выгоду (EV) каждого действия методом Монте-Карло.

  • Показывает на экране, что выгоднее сделать прямо сейчас.

Читать полностью »

Если вы до сих пор считаете, что positional encoding в трансформерах — это знаменитые sin/cos из статьи 2017 года, то боюсь, что собеседование для вас закончится автоматическим реджектом.

Позиционное кодирование заметно эволюционировало с момента появления оригинальной статьи о трансформерах. В современных LLM и моделях компьютерного зрения, таких как FLUX, уже давно не используется классическое sin/cos-кодирование.

Про это почему-то не знают 80% кандидатов на интервью, хотя, казалось бы, эта информация уже давно перешла в разряд «базовой классики».

Читать полностью »

Vision Transformer (ViT) — это архитектура, которая буквально произвела революцию в том, как машины «видят» мир.

В этой статье я не просто объясню, что такое ViT — я покажу вам, как создать эту магию своими руками, шаг за шагом, даже если вы никогда раньше не работали с трансформерами для задач с изображениями.

Для начала давайте взглянем на архитектуру Vision Transformer:

Читать полностью »

Тема компьютерного зрения наряду с искусственным интеллектом в последние годы стала очень популярной. Сегодня компьютерное зрение — это динамичная и быстро развивающаяся область, постоянно расширяющая границы того, что могут видеть и понимать машины.

Однако, зачастую многие публикации посвященные computer vision являются достаточно сложными для тех, кто только погружается в данную тему.

Читать полностью »

"Распознать бы этого шакала"

"Распознать бы этого шакала"

Читать полностью »

На данный момент актуально создание системы обнаружения  беспилотных летательных аппаратов (БПЛА), особенно дронов.

Обнаружение дронов (БПЛА) с использованием ИИ и компьютерного зрения - 1

Системы обнаружения дронов должны выполнять следующие функции:

Крутим Fisheye камеру в синтезированном мире

Крутим Fisheye камеру в синтезированном мире

Всем привет!

Я много работаю с видео для виртуальной реальности, и одна из задач, которая всё ещё маячит на горизонте и требует уймы усилий — удобное создание и стриминг Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js