Рубрика «статистика» - 108

В это воскресенье, 30 сентября, все пользователи в России празднуют 14-тый День Интернета (не путать с Днем Рождения Рунета (7 апреля)).

В 1998-ом московская компания IT Infoart Stars предложила поддержать инициативу о создании этого праздника и провела первую «перепись русскоязычного населения» Интернета, согласно которой число российских пользователей составило 1 млн человек. С тех пор количество пользователей Интернета в России неуклонно возрастало. По данным Координационного центра национального домена сети Интернет, в этом году количество юзеров достигло 59 млн.

К 2012 году в русскоязычном сегменте сети Интернет (Рунете) стало больше не только пользователей, но и доменов. Например, домен .RU, основной национальный домен России, хорошо подготовился к празднику и неделю назад преодолел рубеж в 4 000 000 регистраций, в очередной раз подтвердив свое лидерство.

image

Читать полностью »

Двадцать шестой выпуск подкаста — Сливки IT R&D.
Проблемы с iPhone 5, Shazam сделал новую фичу, Надым и ты туда же, Цукерберг против и многое другое.

Читать полностью »

Вступление

Недавно обсуждал с девушкой-дизайнером, под какие же размеры экрана стóит рисовать сайты. Аргументы наши были, мягко говоря, необоснованными:
— У меня сайт на домашнем компьютере слишком широкий, надо сделать под широкий экран.
— Надо делать под маленькие экраны. Куча народа лезет в Интернет с мобильных устройств. Больших мониторов нет почти ни у кого.
— Да куча народу с такими мониторами! У всех моих знакомых мониторы большие.
— Да у тебя знакомые — дизайнеры да фотографы. А у народа таких мониторов нет!

Понятно, что нужны были более веские аргументы — пора обратиться к статистике.

Подсчёт

Существует некоторое количество сайтов, предоставляющих доступ к собранным данным о своих посетителях. Один из таких сайтов — бывший SpyLog, а ныне — Openstat, выдающий и отчёт о разрешающей способности экранов. Данные там, на первый взгляд, не очень полезны: знание того, что самое популярное разрешение — 1366×768 — встречается у 19 процентов посетителей, мне мало поможет. Но мы можем получить эти данные в виде отдельного файла, который можем обработать. Доступны 4 формата — PDF, XLS и два текстовых: CSV и Tab separated, названный здесь tsv, который мы и возьмём.

Читать полностью »

Nominet, администратор национального домена Великобритании .UK, провел опрос среди 530 компаний на тему внедрения новых доменов верхнего уровня. В число респондентов вошли наиболее известные представители фирмы Великобритании, занимающиеся как крупным, так и средним и мелким бизнесом, и имеющие собственный сайт в интернете. Читать полностью »

Оценить распространенность пиратства в странах — задача нетривиальная и многие агентства представляют цифры, взятые с потолка. Но можно оценить распространенность конкретных технологий файлового обмена, используемых, преимущественно для пиратства.
Речь пойдет о DHT для BitTorrent'a.
Читать полностью »

Карта музыкальных жанров

Вступление

Люди всегда стремились систематизировать музыку, разбивая её на жанры и поджанры. Основным методом такой систематизации был и остаётся «исторический» метод, который можно описать так:
Есть исполнитель K, который играет музыку похожую на жанр L, но явно в этот жанр не вписывающуюся. Сам исполнитель или муз. критик, лейбл придумывают для такой музыки новый под жанр, жанра LLL. и через R лет жанр LL становится каноническим. Или не становится, в зависимости от результатов «проверки временем». Таким образом, все музыкальные жанры можно соединить в граф, в котором жанр L ближе к корню, а LL – к листьям.

Этот метод является историческим, так как поджанры всегда появились позже основных жанров. Т.е. этот способ иллюстрирует развитие музыки, её эволюцию. Но такой граф не совсем корректно иллюстрирует связи жанров друг с другом, с плоской музыкальной точки зрения. Т.е. из двух совершенно разных музыкальных направлений, разных эпох могут появиться поджанры которые будут настолько близки, что значительное число музыкантов будут в качестве своей “лейбы” указывать оба жанра. Но в “историческом” графе они вряд ли будут рядом.
К тому же из-за высокой степени субъективности и сложности исторического метода, не существует “единого дерева жанров”. На сколько я осведомлён, существуют лишь отдельные успешные попытки построить такой граф на уровне отдельных групп близких жанров.
Читать полностью »

Сложно ли угадать PIN код?Несмотря на важную роль PIN-кодов в мировой инфраструктуре, до сих пор не проводилось академических исследований о том, как, собственно, люди выбирают PIN-коды.

Исследователи из университета Кембриджа Sören Preibusch и Ross Anderson исправили ситуацию, опубликовав первый в мире количественный анализ сложности угадывания 4-циферного банковского PIN-кода.Читать полностью »

В прошлых статьях я затрагивал тему простых рейтингов. В комментариях меня попросили расписать тему рейтингов, которые выдают для каждого пользователя свои.
Читать полностью »

В прошлой статье я вывел формулу, которая прогнозирует рейтинг на основе оценок статьи и средней оценки по сайту. Думал в этой статье, я покажу качество ее прогноза, улучшу прогноз за счет дисперсии. Однако, появилась еще одна проблема.
image
Читать полностью »

Прошлая статья привлекла большой интерес. И даже, на некоторое время, стала лучшей за 24 часа. У меня появилось несколько идей и на часть вопросов в комментариях нужно ответить более развернуто.
image

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js