Главная

Рубрика «нечеткое сравнение»

Нечёткое сравнение строк: пойми меня, если сможешь

2017-10-30 в 5:13, admin, рубрики: .net, C#, Алгоритмы, нечеткое сравнение, Программирование, сравнение строк, Управление медиа

Привет!
На естественном языке сказать об одном и том же факте можно бесконечным числом способов. Можно переставлять слова местами, заменять их на синонимы, склонять по падежам (если говорим о языке с падежами) и тд.

Необходимость определять схожесть двух фраз возникла при решении одной небольшой практической задачи. Я не использовал машинное обучение, не вил нейронные сети, но использовал простые метрики и собранную статистику для калибровки коэффициентов.

Результатом работы, описанием процесса, кодом на git'е готов поделиться с вами.

Итак, кратко задачу можно озвучить так: «С определенной периодичностью из различных источников приходят актуальные новости. Необходимо фильтровать их таким образом, чтобы на выходе не было двух новостей об одном и том же факте.»

Предупреждение: в статье присутствуют заголовки реальных новостей. Я отношусь к ним исключительно как к рабочему материалу, не представляю какую-либо точку зрения на политическую или экономическую ситуацию в какой бы то ни было стране.

Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Обсуждаемое

Рекомендуем

Рубрика «нечеткое сравнение»

Нечёткое сравнение строк: пойми меня, если сможешь

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «нечеткое сравнение»

Нечёткое сравнение строк: пойми меня, если сможешь

Новости

Актуальные темы

Архив