Рубрика «computer vision»

Профессия "плотник" полезна в обычной жизни, а что можно сказать о "программисте"? Когда государственной политикой является цифровизация, то правительство должно понимать: цифра она везде цифра! И в обычной жизни придется учитывать и такие истории.

Но сначала, чтоб не тратить время "продвинутых" хабберчан, краткое резюме:
1. уровень технической информации = junior
2. стек = python, ultralytics, YOLO (различных версий)
3. тема = распознование объектов, обучение модели
4. социальная польза = забота об экологии в городе Москва

Читать полностью »

в 21:44, , рубрики: 3d, cnn, computer vision, mask rcnn, python, pytorch3d

1. Описание модели Mask R-CNN 3D

Mask R-CNN 3D – это расширение знаменитой модели Mask R-CNN для работы с трехмерными данными (объёмными изображениями или облаками точек). Классическая Mask R-CNN предназначена для instance segmentation (сегментации отдельных объектов) на 2D-изображениях и состоит из двух основных частей: (1) сети предложений областей (Region Proposal Network, RPN) и (2) головы (Head) с несколькими выходными ветвями для классификации, регрессии ограничивающих рамок и сегментации масок . В версии 3D эта же концепция перенесена в трехмерное пространство.

Читать полностью »

Сразу к карте? Если вы предпочитаете действовать, а не читать, вот ссылка на Mind Map . Она доступна для изучения прямо сейчас. А если хотите понять контекст и узнать больше о каждой модели — добро пожаловать под кат!

Введение

Читать полностью »

Всем привет, меня зовут Евгений Мунин. Я Senior ML Engineer в Ad Tech в платформе ставок для рекламы и автор ТГ канала ML Advertising. В данной статье мы поговорим об одном из способов повышения узнаваемости брендов в спорте, а точнее виртуальной рекламе. Разберем размещение рекламных баннеров на видео и напишем пример на Python и OpenCV, где разместим логотип Adidas с использованием алгоритма детектирования ключевых точек SIFT и гомографии для искажения баннера под перспективу.

Форматы рекламы в спортивных трансляциях

Читать полностью »

Жесты

Жесты, представленные в датасете HaGRIDv2-1M. Новые жесты, добавленные к жестам из HaGRID, выделены красным

В этой статье мы представляем HaGRIDv2-1M — обновлённую и значительно расширенную версию HaGRID, самого полногоЧитать полностью »

Продолжаем разбираться со особенностями МРТ-данных для обучения нейронных сетей. Содержание и первые части цикла статей здесь.

7. Задача выбора нужной серии из исходного набора данных

7.1. Постановка задачи

Читать полностью »

Продолжаем разбираться со особенностями МРТ-данных для обучения нейронных сетей. Содержание и первые части цикла статей здесь.

6. Некоторые библиотеки для работы с МРТ-изображениями

Основной акцент при рассмотрении всех аспектов работы с МРТ-изображениями делается на данных в формате DICOM, которые создаются непосредственно при проведении исследования на МР-томографе, а, значит, не содержат неизвестных искажений от применения различных преобразований.

Читать полностью »

Тема компьютерного зрения достаточно обширна: в ней рассматриваются различные способы распознавания статичных изображений и видео. Однако многие из предлагаемых в интернете решений требуют повышенных вычислительных мощностей, сложного ПО и специального оборудования.

В этой статье мы не будем рассматривать что‑то сложное, а вместо этого разберём создание простого сервера для распознавания изображений на Python.

Выбор языка Python для работы с OCR не случаен. Этот язык поддерживает множество библиотек и фреймворков, некоторые из которых мы будем использовать для создания нашего сервера.

Начинаем установкуЧитать полностью »

3. От сигнала к изображению

Продолжаем разбираться с физическими основами генерации МРТ-данных.

3.1. Импульсные последовательности

Импульсная последовательность (ИП) – это серия радиочастотных и градиентных импульсов заданной формы, амплитуды и интервала между ними, многократно повторяемых во время сканирования.

Каждый РЧ-импульс технически задается векторной амплитудой, определяющей направление поля В1 и длительностью tp. Импульс отклоняет вектор М на определенный угол q в плоскости, перпендикулярной В1.

Читать полностью »

Создаем воспоминания. Осваиваем FLUX, LoRA и ComfyUI - 1

Разбираюсь на праздниках с дообучением моделей для генерации изображений. Было интересно, насколько сложно дообучить модель для генерации изображений по тексту FLUX в домашних условиях, сколько нужно обучающих данных и как затем генерировать качественные фотографии и иллюстрации.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js