Рубрика «статистика» - 9

Вячеслав Ермолин — 1 июля 2020
Результаты пусковых программ за июнь 2020 года.

Июнь. Пора считать ракетки — «их осталось только двое» - 1
Статистика запусков с начала года (июнь). Легенда в конце текста.Читать полностью »

Уже несколько лет я пользуюсь облигациями в качестве замены депозита, потому что процент дохода, который можно получить со вклада стабильно падает. В отличии от ситуации с депозитом, в облигациях всегда можно найти большую доходность. И в этой ситуации меня не устраивало только количество времени на механическую работу по поиску подходящих вариантов бумаг.

Скрипт выборки российских облигаций по параметрам - 1
Работа скрипта по поиску облигаций на Московской бирже

Так как сервисов по поиску российских облигаций много, но ни один из них не имеет достаточной гибкости и простоты и поэтому на работу с ними тратится достаточно много времени. Исходя из этого и решил разработать собственный скрипт для поиска облигаций.

Сделал это на Node.js с выводом полученных результатов в локальный html файл с интерактивной таблицей от Google Charts (а в случае, если JavaScript отключен в браузере, что например происходит при открытии этого html файла из мессенджера на iPhone, то отображается статическая версия таблицы, также сгенерированная скриптом).
Читать полностью »

Самые надежные HDD по версии Backblaze Q1 2020 - 1

Несмотря на все карантинные перипетии, дата-центры продолжают работать. Причем с большей нагрузкой, чем раньше, ведь объем интернет-трафика значительно вырос. Какие жесткие диски справятся с работой лучше всего, в очередной раз выяснила компания Backblaze. Известный облачный сервис хранения данных выпустил отчет о надежности HDD — за I квартал 2020 года.

Количество HDD у Backblaze постоянно увеличивается. На момент формирования отчета в распоряжении компании 132 339 дисков. Из них 2 380 — загрузочные, 129 959 — диски для хранения данных. В отчете отображается статистика по отказам дисков разных компаний и разной емкости.
Читать полностью »

Радует, когда на диаграмме кроме новых созвездий находится нечто похожее на зависимость. В таком случае мы строим модель, которая хорошо объясняет связь между двумя переменными. Но исследователь должен понимать не только, как работать с данными, но и какая история из реального мира за ними лежит. В противном случае легко сделать ошибку. Расскажу о парадоксе Симпсона — одном из самых опасных примеров обманчивых данных, который может перевернуть связь с ног на голову.

Данные всех стран, не объединяйтесь - 1

Читать полностью »

На карантине пользователи стали активнее использовать интернет по ночам, рассказали «Известиям» представители разных операторов. В соцсетях и мессенджерах активность с полуночи до семи утра выросла вдвое, в онлайн-кинотеатрах и видеосервисах — на 55%, на сайтах интернет-магазинов — на 35%. На 27% вырос трафик сервисов для удалённой работы и бизнес-приложений.

Читать полностью »

Госдума РФ 12-го мая вернула ко второму чтению законопроект о едином информационном регистре, в который будут поставлять данные все ведомства знающие о гражданах хоть что-то. Доступ к реестру будет иметь любой сотрудник МФЦ, а данные граждан из него невозможно будет исключить.

  1. В законе заявляются благие цели: совершенствование госуслуг, реализация защиты прав граждан РФ и иностранцев находящихся на территории РФ, Читать полностью »

Большие данные давно стали неотъемлемой частью маркетинга, но они до сих пор окружены мифами. Может ли внедрение big data поднять продажи или компаниям лучше полагаться на свои коммерческие отделы, действительно ли сегодня маркетологи знают о своих потребителях все и заменит ли рекламистов и работников медиаиндустрии искусственный интеллект — об этом в новом выпуске «Медиасреды» с Сергеем Мариным.


Юрий Синодов: Здравствуйте,Читать полностью »

Большой туториал по обработке спортивных данных на python - 1

Последние пару лет в свободное время занимаюсь триатлоном. Этот вид спорта очень популярен во многих странах мира, в особенности в США, Австралии и Европе. В настоящее время набирает стремительную популярность в России и странах СНГ. Речь идет о вовлечении любителей, не профессионалов. В отличие от просто плавания в бассейне, катания на велосипеде и пробежек по утрам, триатлон подразумевает участие в соревнованиях и системной подготовке к ним, даже не будучи профессионалом. Наверняка среди ваших знакомых уже есть по крайней мере один “железный человек” или тот, кто планирует им стать. Массовость, разнообразие дистанций и условий, три вида спорта в одном – все это располагает к образованию большого количества данных. Каждый год в мире проходит несколько сотен соревнований по триатлону, в которых участвует несколько сотен тысяч желающих. Соревнования проводятся силами нескольких организаторов. Каждый из них, естественно, публикует результаты у себя. Но для спортсменов из России и некоторых стран СНГ, команда tristats.ru собирает все результаты в одном месте – на своем одноименном сайте. Это делает очень удобным поиск результатов, как своих, так и своих друзей и соперников, или даже своих кумиров. Но для меня это дало еще и возможность сделать анализ большого количества результатов программно. Результаты опубликиваны на трилайфе: почитать.

Это был мой первый проект подобного рода, потому как лишь недавно я начал заниматься анализом данных в принципе, а также использовать python. Поэтому хочу рассказать вам о техническом исполнении этой работы, тем более что в процессе то и дело всплывали различные нюансы, требующие иногда особого подхода. Здесь будет про скраппинг, парсинг, приведение типов и форматов, восстановление неполных данных, формирование репрезентативной выборки, визуализацию, векторизацию и даже параллельные вычисления.
Читать полностью »

Онлайн-кинотеатрами в апреле 2020 года пользовался 41% опрошенных в рамках исследования потребительских привычек россиян от Google и Ipsos. При этом только 16% от этого числа воспользовались такими сервисами впервые -- это 3,9% от всех опрошенных.

Всего 13% сообщили, что стали экономить на продуктах питания, но 80% перенесли на неопределенный срок крупные покупки.

Доставкой продуктов впервые воспользовались 21% опрошенных, а доставкой еды -- 11%.

Читать полностью »

Глава ассоциации Руссофт Валентин Макаров предупредил, что отечественным IT-компаниям придётся увольнять сотрудников или, как минимум сокращать зарплаты уже во II квартале 2020 года. Из-за пандемии коронавируса только в 16,5% компаниях из опрошенных ассоциацией уверены, что зарплаты будут выплачиваться на всех сотрудников и в полном объёме. Работу могут потерять около 18−20 тыс. программистов, передал оценку МакароваЧитать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js