В настоящей заметке я расскажу о том, как можно построить систему оптического распознавания структурной информации, опираясь на алгоритмы, применяющиеся в обработке изображений и их реализации в рамках библиотеки OpenCV. За описанием системы стоит активно развивающийся open source проект Imago OCR, который может быть непосредственно полезен в распознавании химических структур, однако в заметке я не буду говорить о химии, а затрону более общие вопросы, решение которых поможет в распознавании структурированной информации различного рода, например таблицы или графики.
Читать полностью »
Метка «бинаризация»
Построение системы оптического распознавания структурной информации на примере Imago OCR
2013-03-13 в 19:04, admin, рубрики: open source, opencv, Алгоритмы, бинаризация, векторизация, машинное обучение, обработка изображений, распознавание символов, химия, метки: opencv, бинаризация, векторизация, машинное обучение, распознавание символов, химияБинаризация как более адекватная техника прогнозирования сводных значений
2012-09-10 в 5:41, admin, рубрики: haskell, Алгоритмы, бинаризация, научный менеджмент, оценка, прогнозирование, управление проектами, метки: haskell, бинаризация, научный менеджмент, оценка, прогнозирование, управление проектамиСего дня мы продолжим рассмотрение техник научного менеджмента в применении к управлению проектами. В частности, данная заметка будет продолжением моего описания алгоритма построения графика распределения вероятности для объектов воздействия рисков. Для этого мы рассмотрим, что такое процесс бинаризации, как его применить для более адекватной оценки прогнозных сводных значений, а также посмотрим на реализацию данного алгоритма на прекраснейшем языке программирования Haskell.
Хотелось бы сразу предупредить, что в статье есть немного «матана», так что для её чтения желательно иметь базовые представления о теории вероятности. В частности, необходимо понимание формул для умножения и сложения вероятностей для независимых событий. Более серьёзные темы из теории вероятностей здесь не рассматриваются.