Началось всё с того, что однажды мы увидели гигантскую хреновину (иначе не скажешь), которая выглядела один в один, как гидравлический пресс какого-нибудь завода. Она скрипела, шипела и давила книгу. Вокруг бегали специально обученные операторы и шарахались от каждого её движения.
Выяснилось, что разные архивы, библиотеки, суды и другие структуры закупают сканеры, или, скажем так, классические решения, которые по уровню начинки очень напоминают 90-е годы. Потому что тогда были разработаны первые сканеры для библиотек, и их с тех пор не особо модифицировали.
Задачей сканера было механически выровнять сканируемый материал на плоскости, а потом отсканировать.
С тех пор поменялись две вещи:
— Подходы к конструированию электроники.
— Подходы к машинному зрению.
Первый опыт: датчики давления
Гипотеза: надо прижать книгу к стеклу не со всей дури, сколько есть, а до безопасного давления для руки. Поставить датчики и просто снимать с них показания для подъёмного стола. Это снизит страхи операторов и травматизм.
Второй опыт: выравнивание изображения
С этим результатом мы пришли к одному из заказчиков из судебной сферы. Сшитые документы в судах (чаще всего судебные дела) очень толстые. Такие же кипы документов бывают у инженеров-строителей и в разных архивах.
Гипотеза: можно выравнивать очень многое не вручную, а с помощью машинного зрения. В конце концов, даже с обычного планшета можно сегодня сфотографировать документ и сразу получить его в виде почти что ксерокопии. Чем сканер хуже?
Мы дописали софт, и там появились всякие повороты и наклоны автоматом и с подсказки оператора.
Вот что вышло:
Потом ещё игрались с настройкой предельного значения силы прижима:
Третий опыт: не надо прижимать
У нас на входе в офис стоит 3D-сканер лица, который умеет строить 3D-модель лица по одной фотографии. Делает он это с помощью проектора сетки: сравнивая наложение сетки на лицо, он вычисляет геометрию этого лица. Следующая гипотеза была логична: а зачем прижимать документ, если достаточно спроецировать на него лазерные метки?
Оказалось, достаточно лазерных полосок — вот таких:
Сверху стоит камера, которая снимает.
По ТЗ: сканеры чёрно-белые, поэтому можно просто отсечь длину волны лазера и получить отдельно канал с геометрией и канал с информацией из сканируемого документа.
Затем можно выполнить «восстановление» геометрии до того уровня, когда лазерные линии в результате снова будут прямыми. Вот что получается:
Вот, собственно, конец истории.
Задача, кстати, оказалась очень актуальной для случаев, когда приходится сканировать очень ветхие и разноформатные сшитые документы, чертежи, книги. Когда страница сыплется в труху от неаккуратного прикосновения пальцами, прижать её к плоской поверхности — это всё равно что сразу уничтожить.
Результат
У нас получилось сделать нужное решение и пустить его в серию просто потому, что, видимо, прочим игрокам рынка было неинтересно или не очень выгодно, чтобы сканеры были дешёвыми и работали быстро. Наши сканеры по сочетанию цена–эффект и цена–качество вышли очень и очень хороши.
Откуда растут ноги? Опыт работы с похожими изображениями мы получили, когда распознавали по стране данные сельскохозяйственной переписи. Тогда надо было разбирать рукописный шрифт: планшеты обходчикам дали только на следующей переписи. Плюс у нас есть лаборатория робототехники, где можно быстро собрать прототип любого устройства, которое только возникнет в наших воспалённых мозгах. Собственно, так и произошло. Мы загубили некоторое количество материалов, пока не подобрали правильную модель подъёма стола, долго ковырялись с лазерами, но нашли то что нужно.
Ну и мы — интегратор большого размера, поэтому, когда пришли к одному из заказчиков и показали наш результат, к нам прислушались. И сэкономили.
Вот три поколения наших сканеров и принципы работы:
Сканер с верхним прижимом:
Сканер с прижимом снизу:
Сканер без прижима:
Ссылки
- Сельхозперепись
- Промышленное зрение и мишки-токсикоманы
- Моя почта — bookscan@croc.ru
Автор: TGrigorenko