Рубрика «сегментация» - 2

Фильтр анизотропной диффузии Перона и Малика — это сглаживающий цифровые изображения фильтр, ключевая особенность которого состоит в том, что при сглаживании он сохраняет и «усиливает» границы областей на изображении.

В статье я кратко рассмотрю зачем нужен этот фильтр, теорию по нему и как его реализовать алгоритмически, приведу код на языке Fortran и примеры сглаженных изображений.

Сглаживание изображений фильтром анизотропной диффузии Перона и Малика - 1
Крайнее левое изображение — оригинальное, справа от оригинального — фильтрованные с различными параметрами.
Читать полностью »

Сегментация строки на символы является одним из важнейших этапов в процессе оптического распознавания символов (OCR), в частности, при оптическом распознавании изображений документов. Сегментацией строки называется декомпозиция изображения, содержащего последовательность символов, на фрагменты, содержащие отдельные символы.

Важность сегментации обусловлена тем обстоятельством, что в основе большинства современных систем оптического распознавания текста лежат классификаторы (в том числе — нейросетевые) отдельных символов, а не слов или фрагментов текста. В таких системах ошибки неправильного проставления разрезов между символами как правило являются причиной львиной доли ошибок конечного распознавания.

Поиск границ символов усложняется из-за артефактов печати и оцифровки (сканирования) документа, приводящим к “рассыпанию” и “склеиванию” символов. В случае использования стационарных или мобильных малоразмерных видеокамер спектр артефактов оцифровки существенно пополняется: возможны дефокусировка и смазывание, проективные искажения, деформирование и изгибы документа. При съемке камерой в естественных сценах на изображениях часто возникают паразитные перепады яркости (тени, отражения), а также цветовые искажения и цифровой шум в результате низкой освещенности. На рисунке ниже показаны примеры сложных случаев при сегментации полей паспорта РФ.

Сегментация текстовых строк документов на символы с помощью сверточных и рекуррентных нейронных сетей - 1Сегментация текстовых строк документов на символы с помощью сверточных и рекуррентных нейронных сетей - 2
Сегментация текстовых строк документов на символы с помощью сверточных и рекуррентных нейронных сетей - 3Сегментация текстовых строк документов на символы с помощью сверточных и рекуррентных нейронных сетей - 4
Сегментация текстовых строк документов на символы с помощью сверточных и рекуррентных нейронных сетей - 5Сегментация текстовых строк документов на символы с помощью сверточных и рекуррентных нейронных сетей - 6

В этой статье мы расскажем о методе сегментации символов текстовых строк документов, разработанном нами в Smart Engines, основанный на обучении сверточных и рекуррентных нейронных сетей. Основным рассматриваемым в работе документом является паспорт РФ.
Читать полностью »

В статье описано исследование методов сегментации изображений на различных примерах. Целью исследования является обнаружение достоинств и недостатков некоторых известных методов.

Методы, которые будут рассмотрены в данной статье:

  1. Метод выращивания регионов;
  2. Метод водораздела;
  3. Метод нормальных разрезов.

Исследование методов сегментации на модельных изображениях

Исследование методов сегментации первоначально проводилось моделях изображений. В качестве моделей использовались девять видов изображений.

image

Читать полностью »

В этой статье я расскажу и покажу свой способ сегментации строк на слова. Если вам не интересна жизнь сибиряка в тропиках, можете смело пропускать вступление.

image
Читать полностью »

Это — четвертая статья в серии «11 шагов к хорошему интернет-магазину». Вот — предыдущая (там же — ссылка на остальные).

Для оффлайновой торговли сегментация предложения — давно уже тривиальный ход. Один и тот же холдинг владеет «Пятерочкой» и «Каруселью», Пятерочка позиционируется как доступный магазин для экономных людей, а Карусель — как более модный магазин для более обеспеченных. Соответственно, для Карусели важнее комфортная парковка и просторные торговые залы, а для Пятерочки — шаговая доступность жилых кварталов. Товары при этом и в Пятерочке, и в Карусели примерно одни и те же, а цены — разумеется, разные.

Если это хорошо работает для магазинов вне онлайна, отчего не попробовать тот же подход в интернете? Вот типичный интернет-магазин для аудитории, в которую я не попадаю совершенно:

Читать полностью »

Сегментация целевой аудитории для контекстной рекламы: пошаговый пример - 1
Источник изображения

Представьте, что вы ищете в Яндексе-Гугле чехол для телефона, а вам показывают рекламу сотового поликарбоната. Промах с аудиторией в контексте — деньги на ветер.

Чтобы не «отапливать космос» своими бюджетами, смотрите простую схему выявления потребностей и сегментации целевой аудитории в контекстной рекламе.
При подготовке новых РК она позволит создавать объявления с высокой конверсией, в действующих кампаниях — расширить охват и снизить стоимость клика.
Читать полностью »

3 кейса внедрения динамического контента, увеличившие отдачу от контекстной рекламы в 3 раза - 1

Жизнь директолога опасна и трудна. Не так-то просто собирать целевой трафик, колдовать над снижением цены клика, воевать за позиции с конкурентами. Мы сами через это прошли, пока нам не надоело биться за сотые доли CTR.

В этой статье мы рассказываем как выйти из конкурентной борьбы с помощью динамического контента, показываем результаты повышения конверсии на конкретных примерах.
Читать полностью »

Цели
Определить доминирующие признаки классификации объекта локализации и разработать математическую модель под задачи анализа изображений мимики.

Задачи:
Поиск и анализ способов локализации лица, определение доминирующих признаков классификации, разработка математической модели оптимальной под задачи распознавания движения мимики.

Тема:
Помимо определения оптимального цветового пространства для построения выделяющихся объектов на заданном классе изображения, которая проводилась на предыдущем этапе исследования, немаловажное значение также играет определение доминирующих признаков классификации и разработка математической модели изображений мимики.

Для решения данной задачи необходимо, прежде всего, задать системе особенности модификации задачи обнаружения лица видеокамерой, а затем уже проводить локализацию движения губ.
image
Что касается первой задачи, то следует выделить две их разновидности:
• Локализация лица (Face localization);
• Отслеживание перемещения лица (Face tracking) [1].
Так как перед нами стоит задача разработки алгоритма распознавания мимики, то логично предположить, что данную систему будет использовать один пользователь, который не слишком активно будет двигать головой. Следовательно, для реализации технологии распознавания движения губ необходимо взять за основу упрощенный вариант задачи обнаружения, где на изображении присутствует одно и только одно лицо.

А это значит, что поиск лица можно будет проводить сравнительно редко (порядка 10 кадров/сек. и даже менее). Вместе с тем, движения губ говорящего во время разговора являются достаточно активными, а, следовательно, оценка их контура должна проводиться с большей интенсивностью.
Читать полностью »

Привет! Сегодня я бы хотел продолжить наш цикл материалов жизнь веб-студий и digital-агентств – и поговорить про работу с клиентской базой, а также конкретные принципы/подходы к ее сегментации.

* Кстати, данная тема подробно разбирается и в нашем недавно запущенном бесплатном спецпроекте из 11 видео-лекций про маркетинг, продажи и клиентский сервис в студии.

Часто, общаясь с представителями небольших студий из 10-15 человек, я слышу «У нас 3-4 проекта в производстве и полтора десятка клиентов на поддержке, я знаю их всех в лицо, зачем мне какая-то сегментация и какие-то метрики по ним?». Вобщем-то, это довольно резонный вопрос. Зачем городить дополнительный огород, если все клиенты и так наперечет?

Во-первых, ваша клиентская база – не только ваши текущие клиенты, а еще и «отток» и «отказ» (ниже напишу чуть подробнее). С учетом этого, размер базы из полутора десятков клиентов сразу превращается в несколько десятков/сотен, а то и тысяч, контактов.

Во-вторых, оценка перспективности клиента должна быть не только эмоционально-экспертной («Этот клиент вроде крутой, сейчас он почти ничего на заказывает, но скоро мы его дожмем» или «Да ну их, какая-то мелкая фирма, сайт-визитку им сделали – и ладно, пусть платят за хостинг пару тысяч в месяц»), но и рациональной, основанной на значениях реальных KPI.

Только так мы сможем дать оценку на 360 градусов и избежать ситуации, когда все силы компании брошены на развитие крупного федерального бренда, для которого год назад сделали один баннер и который особо не горит желанием продолжать работу с нами, а небольшой клиент, которому надо кучу всего сделать в интернете, скучает без внимания клиентских менеджеров, потихоньку сливаясь к конкурентам. Читать полностью »

Ключ к успеху при разработке free-to-play игр — анализ поведения игроков и постоянный тюнинг игрового функционала на основе статистики. Собрать статистику — это пол дела. Но как превратить гору сырых данных в информацию?

В моей прошлой статье я перечислила основные показатели, по которым можно отслеживать успешность игры. Во второй части цикла я сделаю обзор основных инструментов, которые помогут превратить данные в руководство к действию.Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js