В прошлом году проект “Карта ДТП” опубликовал исходные кодыЧитать полностью »
Рубрика «Статистика в IT» - 7
Ноль смертей: как выжить в ДТП
2020-10-13 в 11:33, admin, рубрики: vision zero, аварии, Геоинформационные сервисы, Гибдд, ДТП, карта, карта дтп, краудсорсинг, краудфандинг, ноль смертей, открытые данные, Статистика в IT, УрбанизмТолько 4% сотрудников говорят, что хотели бы вернуться в офис: исследование
2020-07-21 в 15:32, admin, рубрики: Facebook, microsoft, Rubrain, исследование, коронавирус, работа, сотрудники, Статистика в IT, удаленная работа, управление персоналом
Мир уже адаптировался к удаленной работе. Новые результаты опроса, проведенного сайтом аналитики Perceptyx, показывают, что только 4% из 750 000 сотрудников из более чем 100 глобальных компаний хотели бы после пандемии вернуться обратно в свой офис на полный рабочий день. Настроение работников сильно поменялось за последние два месяца: видимо, большинство из нас адаптировались к новой ситуации. Ещё недавно в офис хотело вернуться в 8 раз больше людей.Читать полностью »
Парадокс дней рождений на данных ВКонтакте
2020-07-10 в 9:43, admin, рубрики: data mining, Вконтакте, Вконтакте API, Парадокс дней рождений, Статистика в ITПривет!
Я решил проверить парадокс дней рождений на данных, которые доступны из ВК.
Что такое парадокс дней рождений?
Попробуйте ответить на вопрос: Какое количество людей в комнате необходимо, чтобы у двух людей были одинаковые дни рождения с вероятностью 0.5? (дата и месяц). Парадокс дней рождений отвечает на этот вопрос. Читать полностью »
Сколько инструкций процессора использует компилятор?
2020-06-16 в 17:04, admin, рубрики: AArch64, ARMv7, i386, powerpc, sparc, x86_64, визуализация данных, Компиляторы, Процессоры, Статистика в ITМесяц назад я попытался сосчитать, сколько разных инструкций поддерживается современными процессорами, и насчитал 945 в Ice Lake. Комментаторы затронули интересный вопрос: какая часть всего этого разнообразия реально используется компиляторами? Например, некто Pepijn de Vos в 2016 подсчитал, сколько разных инструкций задействовано в бинарниках у него в /usr/bin, и насчитал 411 — т.е. примерно треть всех инструкций x86_64, существовавших на тот момент, не использовались ни в одной из стандартных программ в его ОС. Другая любопытная его находка — что код для x86_64 на треть состоит из инструкций mov
. (В общем-то известно, что одних инструкций mov
достаточно, чтобы написать любую программу.)
Я решил развить исследование de Vos, взяв в качестве «эталонного кода» компилятор LLVM/Clang. У него сразу несколько преимуществ перед содержимым /usr/bin неназванной версии неназванной ОС:
- С ним удобно работать: это один огромный бинарник, по размеру сопоставимый со всем содержимым /usr/bin среднестатистического линукса;
- Он позволяет сравнить разные ISA: на releases.llvm.org/download.html доступны официальные бинарники для x86, ARM, SPARC, MIPS и PowerPC;
- Он позволяет отследить исторические тренды: официальные бинарники доступны для всех релизов начиная с 2003;
- Наконец, в исследовании компиляторов логично использовать компилятор и в качестве подопытного объекта :-)
Начну со статистики по мартовскому релизу LLVM 10.0:
ISA | Размер бинарника | Размер секции .text | Общее число инструкций | Число разных инструкций |
---|---|---|---|---|
AArch64 | 97 МБ | 74 МБ | 13,814,975 | 195 |
ARMv7A | 101 МБ | 80 МБ | 15,621,010 | 308 |
i386 | 106 МБ | 88 МБ | 20,138,657 | 122 |
PowerPC64LE | 108 МБ | 89 МБ | 17,208,502 | 288 |
SPARCv9 | 129 МБ | 105 МБ | 19,993,362 | 122 |
x86_64 | 107 МБ | 87 МБ | 15,281,299 | 203 |
В прошлом топике комментаторы упомянули, что самый компактный код у них получается для SPARC. Здесь же видим, что бинарник для AArch64 оказывается на треть меньше что по размеру, что по общему числу инструкций.
А вот распределение по числу инструкций:
Читать полностью »
Самые надежные HDD по версии Backblaze Q1 2020
2020-06-15 в 12:30, admin, рубрики: hdd, statistics, Блог компании Selectel, жесткие диски, Компьютерное железо, надежность дисков, резервное копирование, статистика, Статистика в ITНесмотря на все карантинные перипетии, дата-центры продолжают работать. Причем с большей нагрузкой, чем раньше, ведь объем интернет-трафика значительно вырос. Какие жесткие диски справятся с работой лучше всего, в очередной раз выяснила компания Backblaze. Известный облачный сервис хранения данных выпустил отчет о надежности HDD — за I квартал 2020 года.
Количество HDD у Backblaze постоянно увеличивается. На момент формирования отчета в распоряжении компании 132 339 дисков. Из них 2 380 — загрузочные, 129 959 — диски для хранения данных. В отчете отображается статистика по отказам дисков разных компаний и разной емкости.
Читать полностью »
Данные всех стран, не объединяйтесь
2020-05-27 в 14:22, admin, рубрики: data mining, Блог компании Wrike, математика, машинное обучение, парадокс симпсона, статистика, Статистика в ITРадует, когда на диаграмме кроме новых созвездий находится нечто похожее на зависимость. В таком случае мы строим модель, которая хорошо объясняет связь между двумя переменными. Но исследователь должен понимать не только, как работать с данными, но и какая история из реального мира за ними лежит. В противном случае легко сделать ошибку. Расскажу о парадоксе Симпсона — одном из самых опасных примеров обманчивых данных, который может перевернуть связь с ног на голову.
Как онлайн-покупки в США изменились из-за коронавируса
2020-05-24 в 11:36, admin, рубрики: amazon, pochtoy, target, walmart, Блог компании Pochtoy.com, доставка, покупки, Статистика в IT, США, Управление e-commerce
Продажи в онлайн-магазинах США в последние недели выросли до небывалых уровней. При этом люди тратят свои деньги заметно иначе, чем до карантина. С марта произошло несколько изменений моделей поведения покупателей. Их проанализировала фирма Earnest Research, отслеживающая миллионы транзакций по банковским картам. А New York Times составила хорошие графики. Они показывают, как что происходит с привычками людей, какие бизнесы выживут в пандемию, и какие онлайн-игроки получают неожиданное преимущество (спойлер: это не только Amazon).Читать полностью »
Сколько инструкций в x86?
2020-05-23 в 17:33, admin, рубрики: 80286, 80386, 8086, Broadwell, Cannon Lake, Haswell, i486, Ice Lake, Ivy Bridge, Knights Landing, Merom, Nehalem, Penryn, pentium, pentium ii, Pentium III, Pentium Pro, Prescott, Sandy Bridge, Skylake, Westmere, Willamette, визуализация данных, старое железо, Статистика в ITvvvphoenix упомянул в своей позавчерашней статье: «Кстати, я пытался найти график роста числа X86 инструкций по годам (или по поколениям). Пока не смог (может, есть у кого?)»
Я решил, что мне это тоже интересно — да настолько, что не жалко потратить выходной день на сведение en.wikipedia.org/wiki/X86_instruction_listings в одну табличку:
Считались различные мнемоники; например, десятки вариантов MOVЧитать полностью »
Нападение на удаленку
2020-05-15 в 18:22, admin, рубрики: атаки, Блог компании RUVDS.com, вирусы, информационная безопасность, Статистика в IT, фишинг, хакеры, Читальный зал
В последние дни российские новостные СМИ пестрят сообщениями о том, что эксперты отмечают рост кибератак на фоне перехода людей на удаленку. Как говорится, кому война, а кому мать родна. Также разные компании, специализирующиеся на информационной безопасности, сходятся во мнении, что характер нападений в 2020-м изменился. Давайте посмотрим, насколько выросло количество хакерских атак с того момента, как люди стали массово работать из дома, какие типы атак на виртуальные серверы и персональные компьютеры вышли в топ и как от них защититься.Читать полностью »
Habr занял первое место в рейтинге соблюдения цифровых прав пользователей
2020-04-17 в 10:24, admin, рубрики: head hunter, mail.ru, transparency, Блог компании РосКомСвобода, Вконтакте, Законодательство в IT, исследование, Исследования и прогнозы в IT, рейтинг, Социальные сети и сообщества, Статистика в IT, цифровые права, яндексПривет! На связи РосКомСвобода! Хотим поделиться с вами хорошими новостями. Мы выпустили исследование «Рейтинг соблюдения цифровых прав популярными веб-сервисами Рунета — 2020». И Habr (как это уже понятно из заголовка) занял первое место в этом рейтинге, опередив такие компании, как Яндекс, ВКонтакте, HeadHunter и других.
Рассказываем, что мы исследовали, на основе каких данных и как Habr выбился в лидеры.
Читать полностью »