Проверки «докажи, что ты не робот» раздражают многих. Да, ReCAPTCHA и другие подобные инструменты помогают отсекать массу ботов и спамеров, но обычные пользователи теряют время и тратят нервные клетки на эти тесты. Поэтому специалисты по информационной безопасности со всего мира пытаются найти альтернативу, кроме того, некоторые специалисты учатся обходить капчу.
Ученым из Мэрилендского университета это удается лучше других. Они назвали свой метод unCaptcha, он позволяет обходить ReCAPTCHA от Google при помощи сервисов самой корпорации Google. Процент удачных попыток превышает 90%. Стоит напомнить, что ReCAPTCHA работает на тысячах сайтов, сервис популярнее многих других. Поэтому, научившись обходить его, специалисты получают обширные возможности.
Пример ReCAPTCHA с возможностью прослушивания информации, требуемой для решения капчи для людей, которые не могут по тем либо иным причинам пройти тесты с фотографиями или символами
Обход стал возможным благодаря работе с сервисом преобразования голоса в текст от Google. Принцип достаточно простой. UnCaptcha загружает аудиофайл ReCAPTCHA (аудио предназначено для тех пользователей, кто по тем либо иным причинам не может работать с изображениями капчи). Далее аудио разделяется на элементы — произносимые буквы и цифры. Элементы сохраняются и загружаются на разные сервисы распознавания голоса и преобразования голоса в текст.
Среди прочих сервисов используется инструмент от Google, о чем говорится выше. Затем распознанные и преобразованные в текст элементы вновь собираются вместе и вводятся в поле распознавания самой капчи. Кроме того, метод использует автоматическое распознавание произносимых фраз, что увеличивает число успешных попыток обхода капчи.
Представители Google в курсе работы ученых — по словам последних, они держат контакт с компанией около полугода. Корпорация особо не переживает по поводу капчи и ее обхода, так что не стала препятствовать публикации результатов работы специалистов.
Годом ранее исследователи разработали ИИ, который научился обходить капчу в 66% случаев. Для этого ученые использовали не обучение нейросети при помощи миллионов изображений капчи, как в обычном случае. Вместо этого нейросеть научили определять форму и начертание символов, что позволило ИИ начать «понимать» капчу.
Если тренировать ИИ на примере обычной капчи, то да, можно добиться высокой точности в ходе этой работы. Успешное распознавание доходит до 89,9%. Но стоит лишь немного изменить начертание изображений, и точность распознавания сразу же падает, причем весьма значительно.
Как-то была создана даже капча, которая предназначена для отсеивания людей. Называется она Humans Not Invited, и человеку пройти тест можно лишь при наличии везения и удачливости.
Выше показана картинка с изображениями именно такой капчи, где нужно найти все элементы с селфи-палкой. Вместо четких картинок мы видим заблюренные кусочки фотографий, где ничего разобрать нельзя. Специальным образом запрограммированный бот справляется с этой задачей без всяких проблем. Но человека как ни учи, ничего распознать не получится.
Что касается буквенных капч, то с ними лучше всего справляются полносверточные нейронные сети, где нет полносвязного слоя. Все это работает так хорошо, что использование символов просто теряет смысл, поскольку нейросеть без проблем проходит проверку. Возможно, в недалеком будущем от капчи вообще откажутся, и на смену ей придет какой-то иной способ защиты от ботов. Но случится это еще не скоро, сейчас капча продолжает неплохо выполнять свое предназначение.
Автор: Максим Агаджанов