Рубрика «рейтинговая система»

Наткнулся на YouTube на топ-20 общественно-политических ютуб-каналов, результат за месяц. Подумал, такое легко сделать самому, заодно изучу API YT и проверю результаты. А готовый алгоритм можно применить и на другие тематические каналы.

Почитал статью на Хабр, посмотрел ролик на YouTube, полистал документацию и приступил писать код на коленке в jupyter notebook.

Читать полностью »

Google научился фильтровать фальшивые установки на Android - 1

Магазин приложений Google Play Store, знакомый пользователям мобильной операционной системы Android, теперь способен распознавать и отфильтровывать установки мошеннических приложений. О расширении функциональности сообщили представители самой компании Google Казуси Нагаяма, аналитик качества поиска и Эндрю Ан, менеджер по продукту. Усовершенствование было представлено в последний день октября.
Читать полностью »

Новый алгоритм расчета рейтинга «Кинопоиска» отдает предпочтение фильмам с платным просмотром. Мини-расследование - 1

Вот вроде отшумели события вокруг перезапуска «Кинопоиска», отошедшие пользователи проводят время на прежнем сайте, разработчики с парсерами строят коварные планы, руководством приняты кадровые решения неоднозначной направленности, а всё остальное вернулось на круги своя. Но не всё.

Откат к прежней версии сайта не коснулся рейтингов фильмов. И хотя на странице Топ-250 мы можем наблюдать хорошо знакомый многим расклад с «Побегом из Шоушенка» и «Зеленой милей» в качестве лидеров, на страницах самих фильмов, в выдаче Гугла и других местах рейтинг отображается новый — тот, который лег в основу Топа-250 бета-версии (у меня он открывается с перебоями; что наблюдалось и сразу после перезапуска).

И по прошествии недели ничего не поменялось, как бы намекая нам, что новый рейтинг останется надолго, если не навсегда. Не исключаю, что вскоре обновится и старый топ, — может, он держится только потому, что алгоритм расчета рейтингов в нем отличается от алгоритма на страницах фильмов («в топе используются специальные механизмы, препятствующие накрутке рейтинга недобросовестными пользователями»), и этот алгоритм корректирует не новый, а старый рейтинг (в основном, в пределах пары сотых долей).

Читать полностью »

90% контента на Хабре генерируют обычные пользователи. Привлечение специалистов к написанию постов в интересах не только сообщества, но и владельцев сайта. В этом плане у Хабра есть давняя проблема: отдача от поста зачастую обратно пропорциональна трудности его создания. Частично ее решили выделением «тематических» хабов. Инвайты и баллы в ППА дают только за посты в тематических хабах. Однако, у этой системы есть проблемы:

  • Судя по списку «тематических» хабов, их точнее описывает слово «техничность». Корреляция между «техничностью» поста и темой (хабом) далеко не 100%. Результат: авторы стремятся добавить пост хоть в один тематический хаб, иногда необоснованно.
  • На мой взгляд, «техничность» — это немного не та метрика, которую надо поощрять. Что я предлагаю взамен — ниже.
  • Поощрения не распространяется на карму, рейтинг и обеспечение внимания к посту.

Разделение новостей и статей решит проблему поощрения гораздо лучше.

Связанная проблема — не до конца оптимальное распределение внимания сообщества к контенту. Хоть и в течение существования Хабра ситуация постоянно улучшалась. На мой взгляд, хорошо помогла бы модерация выбора хабов для поста, потому что авторы зачастую подходят к этому совершенно безответственно. Эта проблема будет скорее за рамками этого поста, но разделение новостей и статей частично решает и ее тоже.

Я неоднократно упоминал идею разделения в комментариях, и писал в поддержку Хабра, и мне даже вроде отвечали, что они думают над тем же, но воз и ныне там. Если сообщество поддержит идею, надеюсь, мы увидим какие-то улучшения на сайте в этом направлении.
Читать полностью »

Добро времени суток. Хочу рассказать о том, как я создавал велосипед для подсчета рейтинга в списке объектов на основе данных о визитах и хитах.

Предметная область

  • имеется веб-ресурс — каталог некоторых сущностей
  • сущности разделены на группы/каталоги
  • у каждый сущности могут быть фото, видео, отзывы, контактные данные
  • в разных категориях сущностей разные средние посещения и просмотры, последние обозначим "k"

Требования

Необходимо внедрить алгоритм сортировки внутри категорий сущностей, который зависит следующих переменных:

  • визиты сущности. Составной ключ: день + ip + id + дополнительное_поле:= «index»
  • визиты страницы с видео. Составной ключ: день + ip + id + дополнительное_поле:= «video»
  • визиты страницы с аудио. Составной ключ аналогично визиту для видео
  • визиты страницы с фото. Составной ключ аналогично визиту для видео
  • просмотры по аналогичным параметрам
  • "k" — среднее количество просмотр в каталоге за единицу времени

Читать полностью »

Итак, тема рейтинговых систем продолжает будоражить умы хабрапользователей. Появляются всё новые и новые схемы, формулы, тесты. И каждый раз всё сводится к одному и тому же вопросу: как совместить среднюю оценку пользователей с нашей уверенностью в этой оценке. Например, если один фильм получил 80 положительных и 20 отрицательных голосов, а другой — 9 положительных и 1 отрицательный, то какой из фильмов лучше? Не претендуя на создание новой универсальной рейтинговой системы, я всё же предложу один из возможных подходов к решению именно этого вопроса.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js