Рубрика «Статистика в IT» - 43

Влияние технологий на среднюю длину песен

Может быть, кто-то задавался вопросом: почему песни на радио примерно одинаковой длины? Действительно, все они заканчиваются примерно за одно время, нет действительно коротких или слишком длинных песен.

Причина этого феномена не известна. Некоторые специалисты высказывают мнение, что она имеет технологический характер: первые фонографы играли 10-дюймовые диски, которые вращались на скорости 78 RPM и могли вместить около 3 минут музыки.
Читать полностью »

Собрал я тут своим вирусом статистику по применяемым типам блокировки сайтов на стороне провайдера.

Названия провайдеров могут оказаться неточными из-за того, что GeoIP-база от MaxMind применялась свежая, а вот GeoISP-базу свежую мне украсть не удалось, поэтому использовалась версия от сентября 2012 года. Из-за этого, иногда в базе можно встретить измерение из России, но провайдера, например, из Чехии. Впрочем, это не проблема.

Итак, некоторые данные:

  • 5076 уникальных (в плане IP, а не провайдера) измерения из РФ
  • 815 провайдеров
  • 315 городов

Читать полностью »

По состоянию на июль 2014 года Python вышел на 1-е место в программах начального обучения программированию в университетах США, пишет журнал Communication of the ACM.

Python вышел на 1 е место для обучения программированию в университетах США

27 из 39 крупнейших факультетов программирования (69%) в университетах предлагают курсы обучения на Python по программам CS0 или CS1 (introductionary courses). Ситуация изменилась в последние три года. В частности, недавно на Python перевели вводные курсы программирования Массачусетский технологический институт и Калифорнийский университет в Беркли.
Читать полностью »

callidus77: Помница в нашей сетке монтажники подключали абонента. Пришли, воткнули сетевуху, а у него Фря и дров нету. Почесали головы и ушли. Чел через три недели наконец-то коннектится.
Грят: «Долго ж ты искал дрова.»
Он: «Я не искал. Я их сам написал.» Баш

Наверное, каждый автор трепетно следит за судьбой своих статей, такому автору на хабре всегда чего-то не хватает. Мне всегда не хватало инструментов наблюдения за статьями — поэтому я и решил их написать.
Пульс Хабра

Под катом мы разберемся с основными инструментами ресурса и потенциальной возможностью применения. Весь инструментарий доступен по адресу http://www.habr-analytics.com, исходный код (основные функции) на github. За примерами и деталями — добро пожаловать под кат!

Структура статьи

  1. Пульс Хабра
  2. Монитор статей
  3. Анализ пользователей
  4. Пересечение хабов — диаграммы Венна
  5. Аудитория хабов
  6. Исходный код и структура проекта
  7. Заключение

*Осторожно трафик*

Читать полностью »

С августа 2013 по июнь 2014 Openstat исследовал общую распространенность и некоторые другие характеристики сайтовых движков — производительность (в целом и для конкретных провайдеров), а также отдельно их распространенность среди подозрительных сайтов и в двенадцати базовых отраслях. Итоги публикуются в этой и последующей статьях.

Читать полностью »

Бельгийский Центр исследования чтения (Center for Reading Research) провёл уникальное, в своём роде, исследование словарного запаса населения. Более 500 000 человек согласились пройти простой словарный тест: на экране появляется слово, а пользователь указывает, известно ему это слово или нет.

Один из результатов исследования — разница словарного запаса мужчин и женщин. К примеру, вот список 12 слов с максимальной разницей между полами, с преимуществом в мужскую пользу. В скобках указан процент мужчин и женщин, которым знакомо слово.

  • кодек (88%, 48%)
  • соленоид (87%, 54%)
  • голем (89%, 56%)
  • мах/mach (93%, 63%) — в английском языке mach имеет единственное значение, в отличие от русского
  • хамви (88%, 58%)
  • клеймор (87%, 58%)
  • ятаган (86%, 58%)
  • кевлар (93%, 65%)
  • паладин (93%, 66%)
  • большевизм (85%, 60%)
  • бипед (86%, 61%)
  • дредноут (90%, 66%)

Читать полностью »

Смех и грех псевдорейтинга
Вчера мне на глаза попалась новость «Россия занимает %какое-то-низкое-место в рейтинге хороших стран». Новость как новость, «рейтинги» такого типа делаются регулярно и во множестве. Но в новости указывался список «самых хороших» стран и сайт-источник. Данные, которые там приведены, вызывают здоровый смех, а методика подсчета — возмущение. О рейтингах и манипуляции данными этот пост.
Читать полностью »

Журнал Forbes обратил внимание на интересную тему, о которой не принято говорить: зависимость зарплаты сотрудника от стажа работы в компании. Выясняется, что на максимальную зарплату могут рассчитывать вовсе не лояльные сотрудники, а совсем наоборот — те, кто часто меняет работу.

У этого явления существует несколько причин. Одна из них — кадровая политика большинства компаний, которая устанавливает потолок на максимальное повышение зарплаты сотрудника. В среднем, в 2013 году зарплаты внутри компаний повышались на 3%. Слабые сотрудники могут рассчитывать на прибавку 1,3%, а самые лучшие — на 4,5%, но не более того. Это примерно соответствует уровню инфляции (2,1% за прошлый год).

В то же время при смене работодателя средняя прибавка к зарплате составляет от 10% до 20%, а иногда и больше.
Читать полностью »

Летят в самолете Петька и
Василий Иванович, Василий Иванович кричит:
— Петька, приборы!
Петька отвечает:
— Двести!
Василий Иванович:
— А что «двести»?
Петька:
— А что «приборы»?

Сегодня выходит из беты наш новый сервис — Яндекс.Город. Он появился как логичное продолжение Яндекс.Справочника, который был единым источником знаний об организациях для всех наших сервисов. Его данные используются собственно в приложении Я.Город, на Яндекс.Картах, в сниппетах на странице результатов поиска, для построения маршрутов в Картах и Навигаторе, определения номера в Яндекс.Ките, выбора мест отправления и прибытия в Такси. Найти места и организации можно было на многих наших площадках, а вот выбирать там не очень удобно. Мы поняли, что пользователям для этого нужен отдельный сервис.

Как мы с помощью математической статистики измеряем качество данных в Яндекс.Городе
У сервиса поиска мест на Яндексе многолетняя история, и к его созданию приложили руку несколько команд. Растёт он из проекта adresa.yandex.ru. Потом Яндекс интегрировал в него бизнес «Жёлтых страниц» — так появился Справочник. Около года назад очень сильно обновилась команда сервиса. И он начал превращаться в Яндекс.Город. Я в этой команде руковожу службой производства данных и сегодня расскажу вам о том, какие у нас метрики и как они помогают нам делать лучшую базу организаций в России.
Читать полностью »

Как известно, ложь делится на обычную, наглую и статистику. И вот немного последней я вам принёс.

Сайт FiveThirtyEight, проанализировав данные Бюро транспортной статистики США с 1995 по 2014 год, обнаружил, что лучшее время для вылета, если вы не любите сидеть в аэропорту на чемоданах весь день — с 6 до 7 утра, средняя задержка в этом интервале составила всего 8,6 минут.

Чем раньше вылет — тем меньше задержка

Задержки рейсов, вылетающих ближе к 6 или между 7 и 8 утра почти также минимальны. Дальше задержки только нарастают, достигая пиковых 20,7 минут к 6 вечера. Следующее лучшее время для вылета — после десяти вечера.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js