Привет. В этом посте мы рассмотрим простую модель фильтрации спама с помощью наивного байесовского классификатора с размытием по Лапласу, напишем несколько строк кода на R, и, наконец, протестируем на англоязычной базе данных смс спама. Вообще, на хабре я нашел две статьи посвященные данной теме, но ни в одной не было наглядного примера, чтобы можно было скачать код и посмотреть результат. Также не было упоминания про размытие, что существенно увеличивает качество модели, без особых затрат усилий, в отличие, скажем, от сложной предобработки текста. Но вообще, запилить очередной пост про наивного байеса меня побудило то, что я пишу методичку для студентов с примерами кода на R, вот и решил поделиться инфой.
Метка «Байес»
Фильтрация смс спама с помощью наивного байесовского классификатора (код на R)
2013-06-25 в 13:39, admin, рубрики: data mining, алгоритм, Алгоритмы, Байес, вероятность, искусственный интеллект, спам, метки: алгоритм, Байес, вероятность, спамБайесовский анализ в Python
2013-02-26 в 9:29, admin, рубрики: python, Алгоритмы, анализ данных, Байес, байесовский подход, искусственный интеллект, математика, метки: python, анализ данных, Байес, байесовский подход Этот пост является логическим продолжением моего первого поста о Байесовских методах, который можно найти тут.
Я бы хотел подробно рассказать о том, как проводить анализ на практике.
Читать полностью »