Рубрика «statistics» - 2

Сервис статистики VPC - 1

В этой статье мы расскажем о том, какие компоненты используются для сбора, обработки и хранения метрик виртуальных машин, приведем примеры настройки использования этих компонентов в проекте VPC.

За получение метрик и их первичную обработку, отвечает компонент OpenStack Ceilometer.

На протяжении долгого времени он был единственным компонентом OpenStack предоставляющим все базовые возможности телеметрии.

В дальнейшем разработчики разделили функции Ceilometer между несколькими продуктами:

  • Aodh — сервис оповещений;
  • Gnocchi — сервис хранения агрегированных измерений;
  • Panko — сервис хранения информации о событиях;
  • Ceilometer — сервис сбора измерений.

Aodh и Panko останутся за рамками этой статьи.
Читать полностью »

Алексей Вставский (App Annie), спикер 6-й Международной мобильной конференции для бизнеса MBLT17.

Анализ показателей по загрузкам и доходам неигровых приложений в App Store и Google Play позволяет сделать выводы о трендах развития мобильного рынка России и всего мира, а также понять какие категорий приложений выгодно монетизировать через встроенные покупки.

Данный обзор не учитывает доходы от рекламы, а рассматривает количество первых платных установок, встроенных покупок и подписок.

1. Рынок приложений растёт и продолжит расти

Количество смартфонов в мире удвоится за следующие 3-4 года и составит более 6 миллиардов устройств. Это увеличит ёмкость рынков развивающихся стран и их привлекательность для издателей.

Доходы будут продолжать расти за счёт развитых стран, так как пользователи в этих странах проводят больше времени в приложениях. Так, например, прирост 2016-го года к 2015-му по этому показателю составил 25% (собственные данные App Annie по Android-устройствам).

Мобильный рынок в цифрах - 1
Читать полностью »

Введение

Начну с конца. Это скриншот с некой web-карты, визуализирующей среднюю стоимость недвижимости на вторичном рынке Саратова и Энгельса:

Статистика по стоимости недвижимости — визуализация на карте - 1

Цвета на карте можно соотнести с цветами на «легенде», цвет на «легенде» соответствует средней стоимости квадратного метра общей площади в тысячах рублей.

Точка на карте соответствует одному предложению по продаже (на вторичном рынке) квартиры с Авито. Всего таких точек, как видно на «легенде», для построения графика использовалось 4943.
Карта в интерактивном виде доступна на GitHub.

А теперь немного предыстории..

Давным-давно…
Читать полностью »

Давным-давно перестал работать 1stat.ru — откровенно говоря, для нас это была трагедия (сейчас вроде он как-то работает).

Рабочий день обычно начинался с чашечки кофе и приятного просмотра значений прироста доменов. Конечно же, такие метрики не показывают ни успешность компании, ни ее капитализацию, ни тип клиентов, которые размещаются у компании. Но, несмотря на это, косвенно можно оценить динамику роста или деградации компании — если количество доменов на NS серверах растет, а не падает — это хорошо. Как показала практика, это, так или иначе, отражает положение дел на рынке.

Статистика распределения доменов по AS, IP, NS, MX и прочим параметрам - 1
Читать полностью »

На обучающих занятиях по PostgreSQL, и на продвинутом, и на базовом курсе, я часто сталкиваюсь с тем фактом, что обучающиеся практически ничего не знают о том, насколько мощными могут быть индексы по выражениям (если они вообще знают об их существовании). Так что позвольте мне сделать для Вас небольшой обзор.
Читать полностью »

«Безграмотными в 21 веке будут не те,
кто не умеет читать и писать,
а те, кто не умеет учиться,
разучиваться и переучиваться»

Элвин Тоффлер

У ИТ-специалистов могут возникать задачи, связанные с анализом производительности оборудования или анализом результатов различных генераторов нагрузки (ioMeter, Vdbench и прочее). В большинстве случаев для этих целей используется Excel с построением временных рядов, с нахождением основных описательных статистик и попытками это все как-то проанализировать. Существует альтернативное средство более быстрого и удобного анализа описательных статистик с разнообразными диаграммами и возможностью создания web-приложения для общего доступа. Касаться настоящей статистики с различными методами анализа данных не буду, только базовая описательная статистика (без проверки тестов и даже p-значения не будет) и разные диаграммы.

В этой статье я опишу один из вариантов того, как можно проанализировать такую информацию, представлять её в виде диаграмм (трафик!), и все это в виде web-приложения. Как следует из названия статьи – реализовано это на R, с пакетом (фреймворком) для web-приложений к R – Shiny.
Читать полностью »

Два года назад я делал опрос «Используете ли вы Java 7?». Похоже, пришла пора его повторить и немного расширить. Особенно при учёте того, что не за горами Java 8: 4 февраля вышел первый Release Candidate.

Под катом разнообразные опросы и сборники предсказаний. Например, интересно бы было посмотреть через год, какой процент людей, считавших, что перейдут на Java 8, действительно это сделают.

Результат прошлого опроса

На момент опроса с релиза Java 7 прошло 6 месяцев и 17 дней. Актуальная версия была 7u3.
Какие версии Java вы используете?

Читать полностью »

Lets fix NAs!Довольно часто встречаются неполные наборы данных, в которых некоторые переменные не определены. В языке R содержимое таких переменных задается как «Not Available» — или сокращенно NA. Соответственно, возникает вопрос, как поступать с неопределенными значениям: стоит ли их игнорировать или откорректировать каким-либо образом?
Читать полностью »

План обслуживания «на каждый день» – Часть 2: Автоматическое обновление статистики В предыдущем посте мы рассматривали автоматическое обслуживание фрагментированных индексов. Теперь пришла очередь статистики.

Собственно для чего она нужна?

При выполнении любого запроса, оптимизатор запросов, в рамках имеющейся у него информации, пытается построить оптимальный план выполнения — который будет отображать из себя последовательность операций, за счет выполнения которых можно получить требуемый результат, описанный в запросе.

В процессе выбора той или иной операции, оптимизатор запросов к числу наиболее важных входных данных относит статистику, описывающую распределение значений данных для столбцов внутри таблицы или индекса. Фактически, строится диаграмма распределения с числом элементов по определенному диапазону значений. Такая оценка количества элементов позволяет оптимизатору запросов создавать более эффективные планы выполнения.
Читать полностью »

От делать нечего решил собрать статистику хабра.
Статистика может быть не совсем отражать действительность, т.к. из 199к статей лишь 75к были открытыми, остальные удаленыскрыты в черновикдоступ к публикации закрыт.
Можно предположить, что большая часть отсутствующих статей заминусована.

Собственно, сами данные:

Среднее количество постов в год:
Хабрастатистика

Средние кол. во. комментариев в постах по годам:
Хабрастатистика
За все время: 46.

Средняя оценка постах по годам:
Хабрастатистика
Средняя оценка за все время: 31.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js