Накрутки на КиноПоиске, посмотрим на аккаунты поближе

в 1:34, , рубрики: kinopoisk.ru, Инфографика, информационная безопасность

По мотивам последних новостей о взломе аккаунтов на КП захотелось побаловаться со статистикой оценок, которую можно частично подсмотреть на сайте.
Примечательно, что уже 18 сентября, в интернете писали, что другим фильмам, выходящим 28 сентября скручивают рейтинг, но КП долго тупил, хотя все аккаунты занижающие рейтинги там были новореги, примерно по две недели. Эти пользователи ставили 2-3 рандомных оценки при регистрации и ещё 2-3 в момент скрутки рейтинга (Притом, что первые три были 5-10, а вторые 3-4-5, т.е. совсем палевно). Я думаю с этих же аккаунтов и накрутили рейтинг ожиданий, другому фильму, который пока не будем называть. Почему их нельзя было подчистить до 28го — загадка, на форуме КП, пару раз в сутки трут по странице комментов на тему…
Ставили оценки лентам: Не твоё тело (2017), Ежик Бобби: Колючие приключения (2016) и Хорошее время (2017), имеют ник вида IvanIvanov96, зареганы менее месяца и поставили менее 20 оценок.
Таких оценок ~10к.

Поскольку в последний раз изучал веб-программирование в 11 классе, то использовать стильно-модно-молодёжные языки программирования пригодные для парсинга интернета не вышло и пользовался тем, что было под рукой, а именно MATLAB-ом. Т.к. КП использует динамически подгружаемые данные на странице оценок, то не придумал ничего лучше, чем долистать ручками до конца, а сайт считает, что 1000 оценок будет достаточно (наверное можно поиграться с параметром prem_max_page и может получится и больше сохранить) и сохранить это в виде html файлика к себе на диск.
Дальше поиском по файлу ищем строки /votes/" class="comm-link" рядом с которыми находятся id интересующих нас пользователей.
Сохранив в массив id пользователей оценки которых нам известны можно посмотреть их профили и странички с оценками. Для этого сохраним странички вида https://www.kinopoisk.ru/user/***id***/ и https://www.kinopoisk.ru/user/***id***/votes/ замечательной командой websave(filename,url,options)
И как только несколько тысяч страничек скачаются (а это долго, тут нужно играться с задержками между запросами, чтобы не ловить ошибки по timeout) можно посмотреть, что же там интересного. В ход идут strfind() и textscan() со всякими кусочками адресов. Мне удалось собрать 3740 оценок отсортированных по дате и ещё 2245 уникальных при сортировке по имени пользователя, итого 5985 страничек оценивших фильм #928796 из 12к всех оценок (не смог найти 6000 оценок 3-4-5, остальных оценок было меньше 1000, так что среди них пропусков нет) оценки к другим двум фильмам с 11к оценками КП скрывает под предлогом малого числа валидных оценок.

Вот так выглядело распределение числа оценок для пользователей с количеством оценок от 1 до 20 и для остальных у кого 21 и более. Присутствует такой заметный пик пользователей с 5 оценками.
Накрутки на КиноПоиске, посмотрим на аккаунты поближе - 1

Регистрировались аккаунты в течение 20 дней, начиная с 24 августа.
Накрутки на КиноПоиске, посмотрим на аккаунты поближе - 2

Если посмотреть за кого ещё активно голосовали эти пользователи, то кроме двух указанных выше фильмов, можно выделить Крым (2017) и Любовь прет-а-порте (2017)
Накрутки на КиноПоиске, посмотрим на аккаунты поближе - 3

Для создания видимости больше пары сотен голосов отдано за фильмы из первой тысячи и последним популярным (типа Зверополиса и Ла-Ла-Ленда), которые уже не идут в кино, распределения у всех примерно похожи, оценки только от 3 до 9 с горкой на 7-8 и небольшим горбиком на 3ке (не понятно зачем). Я вообще с трудом представляю человека, ставящего 3 Побегу из Шоушенка)).

Топ 3 оценок они конечно совсем не палились:
Хорошее время: 5215 подозрительных оценок
Накрутки на КиноПоиске, посмотрим на аккаунты поближе - 4
Не твоё тело: 5090/5215
Накрутки на КиноПоиске, посмотрим на аккаунты поближе - 5
Ежик Бобби: Колючие приключения: 5079/5215
Накрутки на КиноПоиске, посмотрим на аккаунты поближе - 6
И дальше новенькое, хотябы распределение оценок какое-никакое прикрутили…
Любовь прет-а-порте: 4432/5215
Накрутки на КиноПоиске, посмотрим на аккаунты поближе - 7
Крым: 793/5215 (Интересно, скоро ли он попадёт в топ худших)
Накрутки на КиноПоиске, посмотрим на аккаунты поближе - 8

Ну и как пишут на Пикабу, все эти фильмы связывает некто Алексей Пиманов
Накрутки на КиноПоиске, посмотрим на аккаунты поближе - 9

Из 5217 подозрительных аккаунтов 5215 имеют ссылку на страницу в вконтакте, так что думаю люди ставили какую-нибудь игрушку/приложение (типа посмотри кто ходил на твою страницу) в vk и она их регала на КП с их ведома или без, ну или просто имеют лёгкий пароль. Если кто-то хочет поизучать, все ссылки тут. И я очень сомневаюсь, что сообщение от администрации Кинопоиска, дойдёт до пользователей вконтакта и они хоть как-то пошевелятся и оповещать пользователей должна администрация Вконтакте. На мой взгляд КП вполне мог бы совсем подчистить эти аккаунты. А пока я с нетерпением жду, когда Кинопоиск свершит возмездие, про которое напоминает на каждой страничке:

Преступление и наказание

Некоторые пользователи хотят повлиять на рейтинг лучших фильмов КиноПоиска — Топ-250, регистрируя несколько аккаунтов и/или выставляя фильмам только единицы или десятки. Специально для таких посетителей сайта действует простое правило — для расчета рейтинга Топ-250 применяется несколько фильтров, отсеивающих подобные накрутки (рейтинг учитывает голоса регулярно голосующих пользователей, отсеивая 100% ложных десяток и единиц).

Все попытки недобросовестных пользователей «накрутить» рейтинг будут пресечены. В лучшем случае такие оценки будут просто удалены, в худшем случае аккаунт (или аккаунты) редиски будут забанены, доступ к сайту перекрыт, компьютер вскоре сломается, а в доме злоумышленника появится недружелюбное привидение.

Потом не говорите, что вас не предупреждали. :)

Автор: Mogwaika

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js