Рубрика «статистика» - 109

image
Исследование проводилось в целях найти доказательство и отправную точку во времени, когда «мировая агрессия» начала расти. После анализа собранных данных оказалось, что она не просто не растёт, а наоборот. Как простой программист может это доказать? Какие данные использовались и где их брали?
Читать полностью »

DomainTools опубликовал список самых распространенных имен доменов второго уровня, т.е. доменных имен, которые зарегистрированы в как можно большем количестве зон, или самых распространенных имен слева от точки. DomainTools приводит также 10 самых распространенных доменов-брендов.Читать полностью »

Всемирная организация интеллектуальной собственности опубликовала интересную статистику — данные о местоположении ответчиков по жалобам на незаконный захват домена согласно процедуре UDRP, т.е. обвиняемых в киберсквоттинге.

Конечно, эти данные не претендуют на полную объективность. Во-первых, не все жалобы на киберсквоттинг удовлетворяются (хотя таковых большинство). Во-вторых, киберсквоттеры могут указывать о себе заведомо ложные данные. В-третьих, неизвестно, вошли ли в статистику жалобы на захват доменов в национальных доменных зонах и сколько было таких жалоб. Наконец, жалобы поступают далеко не на всех киберсквоттеров. Для большей части компаний обращение в ВОИС — крайняя мера. Тем не менее, полученная информация очень любопытна.Читать полностью »

Домен .COM по праву считается королем доменов верхнего уровня. В этой зоне больше всего зарегистрированных доменов второго уровня, домены в зоне .COM являются самыми ценными, и почти каждая крупная компания стремится получить такой домен. Более того, считается, что почти каждый домен в любой другой зоне (особенно gTLD) имеет свой аналог в зоне .COM.

Так ли это на самом деле? DomainTools провели исследование базы данных доменов и whois, чтобы выяснить, сколько уникальных доменов в каждой доменной зоне. Уникальным доменным именем считается имя, которое не встречается ни в одной другой зоне. Например, Google.com не является уникальным, потому что существует также Google.ru. Процент уникальных доменных имен может показать, какие зоны популярны среди определенного круга пользователей и независимы от авторитета .COM, а какие воспринимаются пользователями как менее престижный вариант главного домена верхнего уровня.Читать полностью »

Мониторинг производительности PHP кода с помощью PinbaДавайте представим себе типичный, набирающий популярность стартап, использующий, например, PHP или Python. Сначала все находится на одном сервере — PHP (или Python), Apache, MySQL. Затем вы выносите MySQL на отдельный сервер, устанавливаете nginx для раздачи контента, возможно, добавляете memcached для кеширования и еще несколько серверов приложений…

Со временем число серверов будет расти, и рано или поздно вы зададитесь вопросами
«А что сейчас вообще происходит с системой? Как часто выполняется тот или иной скрипт и как долго? Какие операции занимают большую часть времени?» Системы мониторинга типа Zabbix дают лишь общую, поверхностную картину состояния приложения.

Чтобы получить ответы на эти вопросы, в Badoo был разработан сервиc мониторинга и статистики в реальном времени — Pinba. В данной статье мы расскажем о нашем опыте использования его для мониторинга и профайлинга нашей системы.
Читать полностью »

В предыдущей статье я рассказал теоретическое обоснование копул. Так как сам был студентом, знаю, что лучшим объяснением теоретического аппарата может служить пример его практического применения. Поэтому в этой статье попробую показать, как копулы используются для моделирования взаимозависимостей нескольких случайных величин.
Пример практического применения копул
Читать полностью »

Бизнес анализ в социальной сети Одноклассники

Этот пост о системах статистики в Одноклассниках. В нем будет рассказано о том, для чего нам нужна статистика, и какие у нас есть системы для работы с ней. В следующих постах детально опишем:

• архитектуру систем;
• основные компоненты систем и алгоритмы;
• нетривиальные проблемы и способы их решенияЧитать полностью »

Мало кто знает, что мы занимаемся не только выпуском мобильных телефонов и пользовательских сервисов вроде Карт Nokia, но и разработкой общественно-полезных технологий.

Многие благотворительные и неправительственные организации постоянно прибегают к сбору и анализу различной информации, поступающей от разных групп населения. Чтобы облегчить процесс анкетирования, мы разработали бесплатный сервис Nokia Data Gathering, позволяющий проводить различные опросы с помощью мобильного телефона интервьюера, а затем молниеносно отправлять данные для последующей обработки.

Nokia Data Gathering: боремся с засухой с помощью мобильного телефона

Работает технология следующим образом. Организация создаёт необходимые анкеты на сервере Nokia Data Gathering, после чего уже оформленные анкеты отправляются на мобильные телефоны интервьюеров. Затем интервьюеры опрашивают людей, заполняя за них полученные анкеты, и после заполнения они автоматически по Сети возвращаются на сервера, где информация от всех опросников аккумулируется, анализируется, привязывается к карте и экспортируется в привычные «офисные» форматы.

Читать полностью »

Уже много лет учёные экспериментируют с алгоритмами, способными предсказывать преступность. Предполагается, что преступники склонны повторять успешные действия — по крайней мере, они не используют ГСЧ для выбора места и времени преступлений, так что их действия предсказуемы по определению.

Например, год назад калифорнийский город Санта-Крус первым в мире внедрил математическую модель расчёта вероятности преступлений, которая каждый день составляет новый маршрут для патрульных машин, основываясь на статистике преступлений по улицам. Учитываются день недели, время суток, наличие/отсутствие футбольных матчей по ТВ и другие факторы.

Исследователь из Бирмингемского университета Мирко Мусолези (Mirco Musolesi) применил совершенно другой подход. Его метод основан не на статистике, а на оперативных данных из сетей сотовой связи. Мусолези начал с того, что научил алгоритм с высокой степень вероятности прогнозировать перемещения каждого абонента: он даже выиграл конкурс Nokia Mobile Data, наиболее точно предсказав перемещения 25-ти добровольцев по сигналам их телефонов, истории звонков и текстовым сообщениям. Иногда алгоритм прогнозирует координаты пользователя с точностью до 20 м2.
Читать полностью »

Хабрастатистика

Собственно после появления довольно интересного и популярного топика Хабракамп товарищ opium создал вопрос, где предложил создать скрипт статистики.

Несмотря на работу, личную жизни и другие факторы, которые затянули создание скрипта, я все-таки его допилил до какой-то кондиции.

Также я столкнулся с проблемами, которые раньше еще не видал.
Полезный опыт, как никак.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js