Рубрика «статистика» - 100

image

Введение

Чуть менее чем год назад я писал на Хабре статью про разрабатываемую мной программу под названием HOLO.image
Если кратко, то программа «слушает» вашу музыкальную коллекцию и затем позволяет визуально исследовать массив собранных данных, а также составлять плейлисты похожих на заданные образцы композиций.
Позитивные отзывы позволили сохранить энтузиазм. На связь даже выходил один человек, который предпринял попытку переписать приложение из .NET WinForms в WPF, но после некоторых промежуточных успехов внезапно скрылся из поля зрения. Я его не виню, так как понимаю что проект содержательно весьма тяжёлый, и будучи программистом по основной работе, уделять достаточно времени на HOLO было затруднительно.
Тем не менее, я и сам затянул с релизом новой версии, но этому есть более позитивные причины, чем банальная лень.

Возможности

Вообще говоря, с точки зрения психологии восприятия звука, задача является очень субьективной. Каждый человек будет по-своему оценивать похожи ли Жанна Агузарова и Земфира, Led Zeppelin и Iron Maiden, System of a Down и Metallica. Но интенсивное тестирование на себе и знакомых показало что кое-какие вещи всё-таки можно выразить цифрами. Для каких-то жанров музыки лучше, для каких-то хуже.
Читать полностью »

Каждый раз, когда я смотрю на диаграммы Ганта [1], меня мучает один и тот же вопрос. Как? Вот как можно быть уверенным, что ресурс А, выполнит задачу Б за 5 дней? Нет, я понимаю, что есть исторические данные, есть, не побоюсь этого слова, статистика. Но вот как можно на основе всего этого делать уверенные прогнозы? Я не понимаю.
Если для вас термины «взаимозависимость событий» и «статистические отклонения» говорят что-то не только по отдельности, но и в совокупности, то статья вас вряд ли заинтересует. А вот если эти термины, употребленные в одном контексте, не говорят вам в чем проблема диаграмм Ганта, то приглашаю под кат, где на простом примере мы это и обсудим.
Читать полностью »

Здесь, на хабре, есть очень интересный показатель, под названием карма. Формируется она самими пользователями, позволяя выражать определенное отношение к другим. Именно поэтому, в качестве статистических данных карма весьма интересный показатель. При помощи анализа такой статистики можно увидеть «настроение» сообщества. В статье я постараюсь немного приоткрыть характер хабросообщества. Хотите с ним поближе познакомиться?Читать полностью »

BootstrapВ институтах студентов учат интегрировать аналитически, а потом обнаруживается, что на практике интегралы почти все считают численными методами. Ну или по крайней мере проверяют таким образом аналитическое решение.

В статистике тоже есть нечестный метод, который позволяет получить примерный ответ на многие практические вопросы без анализа, грубой компьютерной силой: бутстрап (англ. bootstrap). Придумал и опубликовал его в 1979 году Брэдли Эфрон.
Читать полностью »

Примерно полгода назад к нам приехал контейнер телефонов Samsung Galaxy S II ярко розового цвета, которые мы тут же отправили своим сотрудникам. Дальше с ними происходило много интересного: кто-то возил их в машине, кто-то носил в кейсе, а кое-кто собирал из них высокотехнологичные приборы вот такого типа:

Измерение качества мобильного интернета: куда мы дели контейнер розовых Samsung Galaxy S II
Устройство для «информационной разведки»

Зачем нам всё это понадобилось? Всё довольно просто. Дело в том, что в 2012-м моему подразделению была поставлена задача наладить регулярный сбор статистики по качеству мобильного интернета по всей территории присутствия сети Билайн. Читать полностью »

Мне нередко звонят знакомые преклонного возраста (молодежь обычно и сама знает, чего хочет) и просят посоветовать мобильник. Мол, стою я в магазине, в продаже есть то-то и то-то, что выбрать? Так вот еще пару лет назад говорили обычно примерно так: есть хорошая Nokia и есть неплохой Samsung, подскажи, чего предпочесть. В 2013 году ситуация в корне изменилась. Уже несколько раз звонили и просили помочь в выборе между аппаратами локальных российских брендов. При этом модели производителей «первого эшелона» не рассматривались в принципе. На всякий случай спрашивал у товарищей – а как же Samsung, а как же Sony? Отвечали примерно так: «А у нас бюджет 200 баксов. Рука не поднимается платить за 200-долларовый Sony, когда рядом стоит модель марки Х, и у нее экран в полтора раза больше».

Действительно, адекватных вариантов от А-брендов с ценной в 6-7-8 тысяч рублей я не припоминаю. Компании мирового уровня фокусируются на более дорогих моделях – и вкладывают в них, как говорится, всю душу. Естественно, кое-кто с завидным упорством планирует пролезть в «начальный» сегмент, однако эти попытки нельзя назвать сколько-нибудь успешными. Например, буквально вчера имел дело с моделью LG Optimus L5 II Dual за 7 тысяч рублей. (Чуть позже напишу обзор, надо только выклянчить ее в пользование хотя бы на недельку.) Сам по себе аппарат неплохой – правда, пока не вспомнишь, что аналоги от В-брендов стоят почти в два раза дешевле. Причем в плане железа они еще и выигрывают: так, в этом самом L5 II Dual стоит довольно старый «камень» MediaTek MT6575, а в каком-нибудь Highscreen Spark за 3 500 (тоже «двухсимочном», тоже 4-дюймовом и тоже 5-мегапиксельном) – двухъядерный Qualcomm.

Колонка «Другие»: о бюджетных смартфонах и локальных брендах
LG Optimus L5 II Dual
Читать полностью »

image

Нормальное распределение (распределение Гаусса) всегда играло центральную роль в теории вероятностей, так как возникает очень часто как результат воздействия множества факторов, вклад любого одного из которых ничтожен. Центральная предельная теорема (ЦПТ), находит применение фактически во всех прикладных науках, делая аппарат статистики универсальным. Однако, весьма часты случаи, когда ее применение невозможно, а исследователи пытаются всячески организовать подгонку результатов под гауссиану. Вот про альтернативный подход в случае влияния на распределение множества факторов я сейчас и расскажу.
Читать полностью »

С помощью собственного инструмента для проведения автоматизированных тестирований веб-приложений в различных окружениях Selenium компания Sauce Labs получает большие объёмы статистических данных о множестве ошибок. Часто ошибки возникают не из-за плохого кода, не плохого соединения и не из-за заряженных микрочастиц из открытого космоса, а из-за «падения» браузера. Разумеется, в этом случае браузер будет перезапущен, но нам интересна ведомая компанией статистика аварийных завершений, по которой можно судить о надёжности тех или иных браузеров.

Браузеры и частота их падения

Два года назад, в августе 2011 года, Sauce Labs уже публиковала подобную, пусть и менее детальную статистику на основании миллионов тестов, которые проводили клиенты компании. Результаты оказались несколько предсказуемыми, хотя было несколько удивительных фактов.

Конечно же, Internet Explorer 6 оказался среди худших браузеров, но и более новые версии не блистали надёжностью. Надёжным в 2011 году оказался Firefox, хотя не хуже был и Google Chrome с его постоянными обновлениями, не оставляющими пользователя с нестабильной версией. По результатам тестов неплохо себя показал и Opera.
Читать полностью »

Yahoo потеснила Google с первого места в рейтинге наиболее посещаемых интернет-ресурсов по версии ComScore. Впервые с 2008 года Google не на первом месте.

image

Да, впервые за пять лет Google не в топ-1 сайтов в США по количеству обращений. Самое удивительное то, что подвинул его еще недавно переживающий не лучшие времена Yahoo.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js