Главная

Рубрика «антиплагиат» - 2

Трудности перевода: как найти плагиат с английского языка в русских научных статьях

2018-04-24 в 8:07, admin, рубрики: алгоритмы поиска, антиплагиат, Блог компании «Антиплагиат», математика, машинное обучение, машинный перевод, поисковые технологии, Семантика, хэш-функция, шинглы

В нашей первой статье в корпоративном блоге компании Антиплагиат на Хабре я решил рассказать о том, как работает алгоритм поиска переводных заимствований. Несколько лет назад возникла идея сделать инструмент для обнаружения в русскоязычных текстах переведенного и заимствованного текста из оригинала на английском языке. При этом важно, чтобы этот инструмент мог работать с базой источников в миллиарды текстов и выдерживать обычную пиковую нагрузку Антиплагиата (200-300 текстов в минуту).

Трудности перевода: как найти плагиат с английского языка в русских научных статьях - 1 "

В течение 12 лет своей работы сервис Антиплагиат обнаруживал заимствования в рамках одного языка. То есть, если пользователь загружал на проверку текст на русском, то мы искали в русскоязычных источниках, если на английском, то в англоязычных и т. д. В этой статье я расскажу об алгоритме, разработанном нами для обнаружения переводного плагиата, и о том, какие случаи переводного плагиата удалось найти, опробовав это решение на базе русскоязычных научных статей.Читать полностью »

Как мы запускали Хабр для гуманитариев

2016-11-10 в 12:03, admin, рубрики: docker, github, Google API, javascript, Medium, mongodb, node.js, python, wysiwyg-редактор, антиплагиат, Блог компании uTeam, исправление багов, полезные утилиты, Разработка веб-сайтов, тексты для сайта, типографика, яндекс.танк, метки: полезные утилиты

«В следующие два года нужно не пытаться изобразить из себя что-то особенное, а просто быть достаточно умным, чтобы компоновать то, что человечество уже создало» (с) bobuk

Год назад на внутреннем хакатоне наши ростовские ребята за ночь скрестили визуальный текстовый редактор, «Типограф Муравьева» и антиплагиат-сервис. Получилась штука, которая помогала быстро подготовить и отправить публикацию в блог.

Одно время штука жила как сайд-проект, затем нам дали немного ресурсов — ну, как внутреннему стартапу. В итоге получилось удобное коллективное медиа без редакции.

Как мы запускали Хабр для гуманитариев - 1
Старик Гутенберг был бы доволен

Оно позволяет людям читать занятные истории, как дядька-водолаз 40 лет поднимает затонувшие корабли в Баренцевом море, а писателям на популярные нетехнические темы — немного зарабатывать на текстах.

Давайте посмотрим, что учитывать при разработке подобного сервиса, и что выбрать, чтобы без костылей.
Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Обсуждаемое

Рекомендуем

Рубрика «антиплагиат» - 2

Трудности перевода: как найти плагиат с английского языка в русских научных статьях

Как мы запускали Хабр для гуманитариев

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «антиплагиат» - 2

Трудности перевода: как найти плагиат с английского языка в русских научных статьях

Как мы запускали Хабр для гуманитариев

Новости

Актуальные темы

Архив