Главная

Рубрика «computer vision»

AI (Computer Vision) для реальной жизни (или кто для кого готов)

2025-03-27 в 16:19, admin, рубрики: computer vision, python, ultralytics, YOLOv12

Профессия "плотник" полезна в обычной жизни, а что можно сказать о "программисте"? Когда государственной политикой является цифровизация, то правительство должно понимать: цифра она везде цифра! И в обычной жизни придется учитывать и такие истории.

Но сначала, чтоб не тратить время "продвинутых" хабберчан, краткое резюме:
1. уровень технической информации = junior
2. стек = python, ultralytics, YOLO (различных версий)
3. тема = распознование объектов, обучение модели
4. социальная польза = забота об экологии в городе Москва

Читать полностью »

Mask R-CNN 3D

2025-03-20 в 21:44, admin, рубрики: 3d, cnn, computer vision, mask rcnn, python, pytorch3d

1. Описание модели Mask R-CNN 3D

Mask R-CNN 3D – это расширение знаменитой модели Mask R-CNN для работы с трехмерными данными (объёмными изображениями или облаками точек). Классическая Mask R-CNN предназначена для instance segmentation (сегментации отдельных объектов) на 2D-изображениях и состоит из двух основных частей: (1) сети предложений областей (Region Proposal Network, RPN) и (2) головы (Head) с несколькими выходными ветвями для классификации, регрессии ограничивающих рамок и сегментации масок . В версии 3D эта же концепция перенесена в трехмерное пространство.

Читать полностью »

Исследуем эволюцию архитектур в Computer Vision: Mind Map всех ключевых моделей

2025-03-13 в 16:58, admin, рубрики: computer vision, deep learning, machine learning, mind maps, neural networks, resnet, Transformers, машинное обучение, нейронные сети

Сразу к карте? Если вы предпочитаете действовать, а не читать, вот ссылка на Mind Map . Она доступна для изучения прямо сейчас. А если хотите понять контекст и узнать больше о каждой модели — добро пожаловать под кат!

Введение

Читать полностью »

Virtual Ads или как прорекламировать Adidas в CS:GO

2025-03-09 в 17:53, admin, рубрики: AI, computer vision, keypoint detectors, opencv, Компьютерное зрение, рекламные технологии

Всем привет, меня зовут Евгений Мунин. Я Senior ML Engineer в Ad Tech в платформе ставок для рекламы и автор ТГ канала ML Advertising. В данной статье мы поговорим об одном из способов повышения узнаваемости брендов в спорте, а точнее виртуальной рекламе. Разберем размещение рекламных баннеров на видео и напишем пример на Python и OpenCV, где разместим логотип Adidas с использованием алгоритма детектирования ключевых точек SIFT и гомографии для искажения баннера под перспективу.

Форматы рекламы в спортивных трансляциях

Читать полностью »

HaGRIDv2-1M: 1 миллион изображений для распознавания статичных и динамических жестов

2025-03-07 в 10:36, admin, рубрики: computer vision, data mining, data science, datasets, deep learning, detection, device control, gesture recognition, human-computer-interaction, neural networks

Жесты, представленные в датасете HaGRIDv2-1M. Новые жесты, добавленные к жестам из HaGRID, выделены красным

В этой статье мы представляем HaGRIDv2-1M — обновлённую и значительно расширенную версию HaGRID, самого полногоЧитать полностью »

МРТ для DataScience. Часть 7

2025-02-18 в 8:31, admin, рубрики: computer vision, медицинская визуализация, медицинские данные, МРТ

Продолжаем разбираться со особенностями МРТ-данных для обучения нейронных сетей. Содержание и первые части цикла статей здесь.

7. Задача выбора нужной серии из исходного набора данных

7.1. Постановка задачи

Читать полностью »

МРТ для DataScience. Часть 6

2025-02-14 в 10:13, admin, рубрики: computer vision, медицинская визуализация, медицинские данные, МРТ

6. Некоторые библиотеки для работы с МРТ-изображениями

Основной акцент при рассмотрении всех аспектов работы с МРТ-изображениями делается на данных в формате DICOM, которые создаются непосредственно при проведении исследования на МР-томографе, а, значит, не содержат неизвестных искажений от применения различных преобразований.

Читать полностью »

Разворачиваем простой OCR-сервер на Python

2025-02-11 в 9:51, admin, рубрики: computer vision, OCR-технологии, python, Компьютерное зрение, распознавание изображений

Тема компьютерного зрения достаточно обширна: в ней рассматриваются различные способы распознавания статичных изображений и видео. Однако многие из предлагаемых в интернете решений требуют повышенных вычислительных мощностей, сложного ПО и специального оборудования.

В этой статье мы не будем рассматривать что‑то сложное, а вместо этого разберём создание простого сервера для распознавания изображений на Python.

Выбор языка Python для работы с OCR не случаен. Этот язык поддерживает множество библиотек и фреймворков, некоторые из которых мы будем использовать для создания нашего сервера.

Начинаем установкуЧитать полностью »

МРТ для DataScience. Часть 3

2025-01-28 в 7:00, admin, рубрики: computer vision, медицинская визуализация, медицинские данные, МРТ

3. От сигнала к изображению

Продолжаем разбираться с физическими основами генерации МРТ-данных.

3.1. Импульсные последовательности

Импульсная последовательность (ИП) – это серия радиочастотных и градиентных импульсов заданной формы, амплитуды и интервала между ними, многократно повторяемых во время сканирования.

Каждый РЧ-импульс технически задается векторной амплитудой, определяющей направление поля В₁ и длительностью t_p. Импульс отклоняет вектор М на определенный угол q в плоскости, перпендикулярной В₁.

Читать полностью »

Создаем воспоминания. Осваиваем FLUX, LoRA и ComfyUI

2025-01-03 в 15:02, admin, рубрики: computer vision, flux, машинное обучение, нейросети, Стругацкие

Разбираюсь на праздниках с дообучением моделей для генерации изображений. Было интересно, насколько сложно дообучить модель для генерации изображений по тексту FLUX в домашних условиях, сколько нужно обучающих данных и как затем генерировать качественные фотографии и иллюстрации.

Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Обсуждаемое

Рекомендуем

Рубрика «computer vision»

AI (Computer Vision) для реальной жизни (или кто для кого готов)

Mask R-CNN 3D

1. Описание модели Mask R-CNN 3D

Исследуем эволюцию архитектур в Computer Vision: Mind Map всех ключевых моделей

Введение