Рубрика «спам» - 7

Авто.ру научился считать число телефонных звонков продавцам

2016-09-19 в 11:01, admin, рубрики: Auto.ru, Drom.ru, mail.ru, авто, Классифайды, Москва, спам, Текучка, Яндекс.Авто, метки: Auto.ru, avito., Drom.ru, mail.ru, авто, Классифайды, Москва, спам, Текучка, Яндекс.Авто

Авто.ру начал скрывать настоящие телефонные номера продавцов в объявлениях. Пока услуга доступна только москвичам, также планируется запуск в регионах. Об этом сообщается в официальном пресс-релизе компании.

Читать полностью »

GFI MailEssentials: почта под защитой

2016-07-05 в 13:39, admin, рубрики: gfi archiver, антиспам для exchange, Блог компании AFI Distribution, защита от вредоносных программ, защита от спама, информационная безопасность, ит-инфраструктура, почта, системное администрирование, спам

Продукт MailEssentials компании GFI хорошо известен многим администраторам Exchange, особенно в малых и средних компаниях. Он защищает серверы Exchange или другую систему электронной почты на базе SMTP от спама и вредоносных программ. Тем же, кто ещё не знаком с данным продуктом, мы попробуем кратко рассказать, что он собой представляет и чем может быть полезен для вашей организации.

GFI MailEssentials: почта под защитой - 1

Читать полностью »

SpamFireWall — запрет доступа к сайту для спам ботов

2016-06-01 в 8:43, admin, рубрики: anti-spam, cms, антиспам, антиспам защита, Блог компании CleanTalk Anti-Spam, информационная безопасность, Разработка веб-сайтов, спам, метки: анти спам

Каждый владелец веб-сайта или вебмастер сталкивался с таким бичом, как спам в комментариях или формах контактов, а также регистрация спамботов под видом пользователей. В результате форма на сайте обрабатывает эти сообщения, что тратит ресурсы сервера. Некоторые спам боты загружают страницы сайта для обхода антиспам-защиты, из-за чего ресурсов тратится еще больше. На небольших объемах это незаметно, но когда веб-сайт в сутки получает тысячи подобных запросов, это может существенно влиять на нагрузку процессора сервера.

Сейчас мы расскажем о новой опции в антиспам-плагинах для CleanTalk, которая позволяет эффективно отражать атаки спамботов на ваш сайт. Опция получила название SpamFireWall(SFW), она блокирует POST- и GET-запросы от наиболее активных спамботов и не дает им загружать сервер.
Читать полностью »

Невизуальные методы защиты сайта от спама. Часть 3. Повторы

2016-05-23 в 5:55, admin, рубрики: anti-spam, антиспам, антиспам защита, Блог компании CleanTalk Anti-Spam, защита от ботов, информационная безопасность, Разработка веб-сайтов, спам

Продолжение статьи Невизуальные методы защиты сайта от спама

Часть 3. Повторы подстрок

Как уже говорилось, невизуальные методы защиты сайта от спама используют анализ текста. Один из часто встречающихся сигналов спама — это наличие повторяющихся строк. Как всегда, приведённые примеры взяты из реальных данных компании CleanTalk.

Поиск таких повторов должен быть минимально ресурсоёмким. Лучше, если он будет вызываться после тестов из 1 и 2 частей статьи, которые отсеют явный спам и приведут текст к виду, пригодному для анализа. Здесь я приведу некоторую статистику, а также пример кода.
Читать полностью »

Невизуальные методы защиты сайта от спама. Часть 2. Истинное лицо символов

2016-05-11 в 9:40, admin, рубрики: антиспам, антиспам защита, Блог компании CleanTalk Anti-Spam, защита от ботов, информационная безопасность, Разработка веб-сайтов, спам

Продолжение статьи Невизуальные методы защиты сайта от спама

Часть 2. Истинное лицо символов

Невизуальные методы защиты сайта от спама используют, в частности, анализ переданного текста. Спамеры используют много приёмов, чтобы усложнить такой анализ. Здесь будут показаны примеры одного из них, а именно подстановки символов. Приведённые примеры взяты из реальных данных компании CleanTalk.

Подстановка символов очень проста, но в результате неё могут не работать фильтры по стоп-словам, могут хуже работать байесовские фильтры, а также фильтры с определением языка. Поэтому перед применением этих фильтров имеет смысл вернуть символам их истинное лицо.
Читать полностью »

11 шагов к хорошему интернет-магазину. Искусство общения

2016-04-27 в 16:26, admin, рубрики: gtd, ui/ux, интернет-магазин, интернет-маркетинг, интернет-торговля, искусство общения, клиентоориентированность, клиентское обслуживание, Медиа, спам, Управление e-commerce

Сегодня у нас — седьмой шаг из одиннадцати. Говорим об общении на пользу вместо вреда.

Краткое содержание предыдущих серий

Соответствуйте ожиданиям.
Делайте сайт простым.
Показывайте актуальный склад.
Позволяйте клиентам платить картой.
Сегментируйте предложение.
Предлагайте нужные сопутствующие товары.

Общайтесь только по делу

Читать полностью »

Невизуальные методы защиты сайта от спама. Часть 1. Статистика

2016-04-27 в 13:18, admin, рубрики: антиспам, антиспам защита, Блог компании CleanTalk Anti-Spam, защита от ботов, информационная безопасность, Разработка веб-сайтов, спам

Часть 1. Что говорит статистика

Невизуальные методы защиты сайта от спама предполагают автоматический анализ поступающих от посетителя данных. Чем больше данных анализируется, тем полнее и точнее может быть определён посетитель и вынесено решение спамер он или нет.

Системы, анализирующие такие данные, как правило, накапливают статистику данных посетителя и вынесенных решений. Вашему вниманию предлагается краткий обзор статистических данных, накопленных нами (сервисом защиты сайтов от спама CleanTalk).
Читать полностью »

Революция машинного обучения: общие принципы и влияние на SEO

2016-02-12 в 8:05, admin, рубрики: Google, machine learning, seo, машинное обучение, поисковая оптимизация, поисковые системы, поисковые технологии, ранжирование, спам

Предлагаю вашему вниманию перевод статьи "Революция машинного обучения" за авторством Эрика Энжа (Eric Enge).

Машинное обучение уже само по себе является серьезной дисциплиной. Оно активно используется вокруг нас, причем в гораздо более серьезных масштабах, чем вы можете себе представить. Несколько месяцев назад я решил углубиться в эту тему, чтобы узнать о ней больше. В этой статье я расскажу о некоторых базовых принципах машинного обучения, а также поделюсь своими рассуждениями по поводу его влияния на SEO и digital-маркетинг.

Для справки, рекомендую посмотреть презентацию Рэнда Фишкина «SEO in a Two Algorithm World», где Рэнд подробно рассматривает влияние машинного обучения на поиск и SEO. К этой теме я еще вернусь.

Я также упомяну сервис, который позволяет спрогнозировать шансы ретвита вашего поста на основании следующих параметров: показатель Followerwonk Social Authority, наличие изображений, хэштегов и некоторых других факторов. Я назвал этот сервис Twitter Engagement Predictor (TEP). Чтобы разработать такую систему мне понадобилось создать и обучить нейронную сеть. Вы указываете исходные параметры твита, сервис обрабатывает их и прогнозирует шансы ретвита.
Читать полностью »

Поиск множества регулярных выражений при помощи библиотеки Hyperscan

2016-01-19 в 13:03, admin, рубрики: C, c++, intel, PCRE, regexp, rspamd, высокая производительность, системное программирование, спам

В данной статье я бы хотел рассказать о собственном опыте оптимизации выполнения множества регулярных выражений при помощи системы hyperscan. Так вышло, что при разработке своего спам-фильтра rspamd я столкнулся с необходимостью портировать большой объем старых правил, написанных для spamassassin за несколько лет работы. Моим первым решением было написать плагин, который бы читал эти правила и строил из них синтаксическое дерево. Затем на этом дереве выполнялись различные оптимизации, чтобы сократить общее время выполнения (об этом я даже делал небольшую презентацию).

К сожалению, в ходе эксплуатации выяснилось, что pcre все равно являются узким местом, и на больших письмах этот набор правил работает слишком медленно. Выяснилось, например, что на письме размером в мегабайт pcre проверяет около гигабайта (!) текста. Различные трюки, вроде ограничения количества текста для регулярных выражений, оказывали негативное влияние на срабатывания правил, а оптимизации pcre путем интенсивного использования jit fast path через pcre_jit_exec оказались слишком опасными — некоторые старые выражения были откровенно некорректными и в сочетании с некорректным входным текстом, например, содержащим «битые» UTF8 символы, приводили к воспроизводимым багам с повреждением стека программы. Однако на конференции highload мы поговорили со Славой Ольховченковым, и он мне посоветовал посмотреть на hyperscan. Далее я перейду к сути и расскажу, что из этого получилось.
Читать полностью »

В Mail.ru заработал сервис создания одноразовых почтовых адресов для защиты от «неспама»

2015-12-21 в 7:06, admin, рубрики: email, mail.ru, запуск, почта mail.ru, спам, Текучка

В почте Mail.ru заработал сервис для создания временных адресов «Анонимайзер». В компании предполагают, что сервис можно использовать для того, чтобы защититься от нежелательных писем. «Строго говоря, это может быть и не спам, а назойливые письма от тех, Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «спам» - 7

Авто.ру научился считать число телефонных звонков продавцам

GFI MailEssentials: почта под защитой

SpamFireWall — запрет доступа к сайту для спам ботов

Невизуальные методы защиты сайта от спама. Часть 3. Повторы

Часть 3. Повторы подстрок

Невизуальные методы защиты сайта от спама. Часть 2. Истинное лицо символов

Часть 2. Истинное лицо символов

11 шагов к хорошему интернет-магазину. Искусство общения

Краткое содержание предыдущих серий

Общайтесь только по делу

Невизуальные методы защиты сайта от спама. Часть 1. Статистика

Часть 1. Что говорит статистика

Революция машинного обучения: общие принципы и влияние на SEO

Поиск множества регулярных выражений при помощи библиотеки Hyperscan

В Mail.ru заработал сервис создания одноразовых почтовых адресов для защиты от «неспама»

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «спам» - 7

Часть 3. Повторы подстрок

Часть 2. Истинное лицо символов

Краткое содержание предыдущих серий

Общайтесь только по делу

Часть 1. Что говорит статистика

Новости

Актуальные темы

Архив