Рубрика «статистика» - 108

Карта музыкальных жанров

Вступление

Люди всегда стремились систематизировать музыку, разбивая её на жанры и поджанры. Основным методом такой систематизации был и остаётся «исторический» метод, который можно описать так:
Есть исполнитель K, который играет музыку похожую на жанр L, но явно в этот жанр не вписывающуюся. Сам исполнитель или муз. критик, лейбл придумывают для такой музыки новый под жанр, жанра LLL. и через R лет жанр LL становится каноническим. Или не становится, в зависимости от результатов «проверки временем». Таким образом, все музыкальные жанры можно соединить в граф, в котором жанр L ближе к корню, а LL – к листьям.

Этот метод является историческим, так как поджанры всегда появились позже основных жанров. Т.е. этот способ иллюстрирует развитие музыки, её эволюцию. Но такой граф не совсем корректно иллюстрирует связи жанров друг с другом, с плоской музыкальной точки зрения. Т.е. из двух совершенно разных музыкальных направлений, разных эпох могут появиться поджанры которые будут настолько близки, что значительное число музыкантов будут в качестве своей “лейбы” указывать оба жанра. Но в “историческом” графе они вряд ли будут рядом.
К тому же из-за высокой степени субъективности и сложности исторического метода, не существует “единого дерева жанров”. На сколько я осведомлён, существуют лишь отдельные успешные попытки построить такой граф на уровне отдельных групп близких жанров.
Читать полностью »

Сложно ли угадать PIN код?Несмотря на важную роль PIN-кодов в мировой инфраструктуре, до сих пор не проводилось академических исследований о том, как, собственно, люди выбирают PIN-коды.

Исследователи из университета Кембриджа Sören Preibusch и Ross Anderson исправили ситуацию, опубликовав первый в мире количественный анализ сложности угадывания 4-циферного банковского PIN-кода.Читать полностью »

В прошлых статьях я затрагивал тему простых рейтингов. В комментариях меня попросили расписать тему рейтингов, которые выдают для каждого пользователя свои.
Читать полностью »

В прошлой статье я вывел формулу, которая прогнозирует рейтинг на основе оценок статьи и средней оценки по сайту. Думал в этой статье, я покажу качество ее прогноза, улучшу прогноз за счет дисперсии. Однако, появилась еще одна проблема.
image
Читать полностью »

Прошлая статья привлекла большой интерес. И даже, на некоторое время, стала лучшей за 24 часа. У меня появилось несколько идей и на часть вопросов в комментариях нужно ответить более развернуто.
image

Читать полностью »

image
Исследование проводилось в целях найти доказательство и отправную точку во времени, когда «мировая агрессия» начала расти. После анализа собранных данных оказалось, что она не просто не растёт, а наоборот. Как простой программист может это доказать? Какие данные использовались и где их брали?
Читать полностью »

DomainTools опубликовал список самых распространенных имен доменов второго уровня, т.е. доменных имен, которые зарегистрированы в как можно большем количестве зон, или самых распространенных имен слева от точки. DomainTools приводит также 10 самых распространенных доменов-брендов.Читать полностью »

Всемирная организация интеллектуальной собственности опубликовала интересную статистику — данные о местоположении ответчиков по жалобам на незаконный захват домена согласно процедуре UDRP, т.е. обвиняемых в киберсквоттинге.

Конечно, эти данные не претендуют на полную объективность. Во-первых, не все жалобы на киберсквоттинг удовлетворяются (хотя таковых большинство). Во-вторых, киберсквоттеры могут указывать о себе заведомо ложные данные. В-третьих, неизвестно, вошли ли в статистику жалобы на захват доменов в национальных доменных зонах и сколько было таких жалоб. Наконец, жалобы поступают далеко не на всех киберсквоттеров. Для большей части компаний обращение в ВОИС — крайняя мера. Тем не менее, полученная информация очень любопытна.Читать полностью »

Домен .COM по праву считается королем доменов верхнего уровня. В этой зоне больше всего зарегистрированных доменов второго уровня, домены в зоне .COM являются самыми ценными, и почти каждая крупная компания стремится получить такой домен. Более того, считается, что почти каждый домен в любой другой зоне (особенно gTLD) имеет свой аналог в зоне .COM.

Так ли это на самом деле? DomainTools провели исследование базы данных доменов и whois, чтобы выяснить, сколько уникальных доменов в каждой доменной зоне. Уникальным доменным именем считается имя, которое не встречается ни в одной другой зоне. Например, Google.com не является уникальным, потому что существует также Google.ru. Процент уникальных доменных имен может показать, какие зоны популярны среди определенного круга пользователей и независимы от авторитета .COM, а какие воспринимаются пользователями как менее престижный вариант главного домена верхнего уровня.Читать полностью »

Мониторинг производительности PHP кода с помощью PinbaДавайте представим себе типичный, набирающий популярность стартап, использующий, например, PHP или Python. Сначала все находится на одном сервере — PHP (или Python), Apache, MySQL. Затем вы выносите MySQL на отдельный сервер, устанавливаете nginx для раздачи контента, возможно, добавляете memcached для кеширования и еще несколько серверов приложений…

Со временем число серверов будет расти, и рано или поздно вы зададитесь вопросами
«А что сейчас вообще происходит с системой? Как часто выполняется тот или иной скрипт и как долго? Какие операции занимают большую часть времени?» Системы мониторинга типа Zabbix дают лишь общую, поверхностную картину состояния приложения.

Чтобы получить ответы на эти вопросы, в Badoo был разработан сервиc мониторинга и статистики в реальном времени — Pinba. В данной статье мы расскажем о нашем опыте использования его для мониторинга и профайлинга нашей системы.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js