Специальный шрифт для нахождения ошибок после OCR

в 20:40, , рубрики: ocr, краудсорсинг, оцифровка книг, типографика, электронные книги, метки: ,

Сообщество Distributed Proofreaders («Распределённые корректоры») больше десяти лет занимается сканированием книг для проекта «Гутенберг». Сотни добровольцев помогают вычитывать тексты и исправлять ошибки.

После автоматического распознавания чаще всего ошибки встречаются в символах, которые похожи друг на друга, как I, l и 1, O и 0, и так далее. Поэтому для проекта Distributed Proofreaders был создан специальный шрифт , в котором «похожие» символы как можно сильнее отличаются друг от друга.

Специальный шрифт для нахождения ошибок после OCR

Все символы шрифта разработаны с учётом многочисленных советов и пожеланий участников проекта, добровольных корректоров. Цель — максимально удобно и эффективно идентифицировать типичные ошибки OCR.

К сожалению, сайт Distributed Proofreaders по историческим причинам не поддерживает юникод, и сообщество работает с весьма ограниченным списком языков, среди которых нет кириллических. Поэтому и сам шрифт DPCustomMono2 спроектирован только для латиницы. Но идеи, которые применили дизайнеры шрифта, можно использовать и в создании кириллического набора символов.

На этой странице можно сравнить DPCustomMono2 с различными популярными шрифтами.

Специальный шрифт для нахождения ошибок после OCR

Автор: alizar

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js