Рубрика «визуализация данных» - 9

Что общего у научной визуализации данных и геймдева — обсуждаем в новом подкасте «ITMO Research_»

2020-06-20 в 8:35, admin, рубрики: Блог компании Университет ИТМО, визуализация данных, игрострой, Исследования и прогнозы в IT, научная визуализация, разработка игр, разработка компьютерных игр, Университет ИТМО, Учебный процесс в IT

Это вторая часть интервью с Андреем Карсаковым (kapc3d), к.т.н., старшим научным сотрудником Национального центра когнитивных разработок, доцентом Факультета цифровых трансформаций.

С 2012 года Андрей работает в научной группе Визуализация и компьютерная графика. Занимается крупными прикладными проектами на государственном и международном уровне.

Читать полностью »

Хабрастатистика: как Хабр пережил самоизоляцию

2020-06-19 в 15:28, admin, рубрики: covid, matplotlib, python, Анализ и проектирование систем, визуализация данных, Программирование, самоизоляция, Социальные сети и сообщества

Привет.

Заканчивается первая половина 2020 года, можно подвести некоторые статистические итоги, тем более что по понятным причинам они обещают быть интересными. Появились новые темы для обсуждения, многие стали работать из дома, любопытно посмотреть, как это сказалось на количестве статей и их популярности.

Хабрастатистика: как Хабр пережил самоизоляцию - 1

Для тех, кому интересно, что получилось, продолжение под катом.Читать полностью »

Сколько инструкций процессора использует компилятор?

2020-06-16 в 17:04, admin, рубрики: AArch64, ARMv7, i386, powerpc, sparc, x86_64, визуализация данных, Компиляторы, Процессоры, Статистика в IT

Месяц назад я попытался сосчитать, сколько разных инструкций поддерживается современными процессорами, и насчитал 945 в Ice Lake. Комментаторы затронули интересный вопрос: какая часть всего этого разнообразия реально используется компиляторами? Например, некто Pepijn de Vos в 2016 подсчитал, сколько разных инструкций задействовано в бинарниках у него в /usr/bin, и насчитал 411 — т.е. примерно треть всех инструкций x86_64, существовавших на тот момент, не использовались ни в одной из стандартных программ в его ОС. Другая любопытная его находка — что код для x86_64 на треть состоит из инструкций mov. (В общем-то известно, что одних инструкций mov достаточно, чтобы написать любую программу.)

Я решил развить исследование de Vos, взяв в качестве «эталонного кода» компилятор LLVM/Clang. У него сразу несколько преимуществ перед содержимым /usr/bin неназванной версии неназванной ОС:

С ним удобно работать: это один огромный бинарник, по размеру сопоставимый со всем содержимым /usr/bin среднестатистического линукса;
Он позволяет сравнить разные ISA: на releases.llvm.org/download.html доступны официальные бинарники для x86, ARM, SPARC, MIPS и PowerPC;
Он позволяет отследить исторические тренды: официальные бинарники доступны для всех релизов начиная с 2003;
Наконец, в исследовании компиляторов логично использовать компилятор и в качестве подопытного объекта :-)

Начну со статистики по мартовскому релизу LLVM 10.0:

ISA	Размер бинарника	Размер секции .text	Общее число инструкций	Число разных инструкций
AArch64	97 МБ	74 МБ	13,814,975	195
ARMv7A	101 МБ	80 МБ	15,621,010	308
i386	106 МБ	88 МБ	20,138,657	122
PowerPC64LE	108 МБ	89 МБ	17,208,502	288
SPARCv9	129 МБ	105 МБ	19,993,362	122
x86_64	107 МБ	87 МБ	15,281,299	203

В прошлом топике комментаторы упомянули, что самый компактный код у них получается для SPARC. Здесь же видим, что бинарник для AArch64 оказывается на треть меньше что по размеру, что по общему числу инструкций.

А вот распределение по числу инструкций:
Сколько инструкций процессора использует компилятор? - 1 Читать полностью »

Красивая и подробная геологическая карта Марса, сделанная на Python, GDAL

2020-06-14 в 14:35, admin, рубрики: data viz, GDAL, maps, Pyhon, python, science art, астрономия, визуализация данных, графический дизайн, дизайн, карты

На этой неделе — творческое переосмысление геологической (или все же ареологической?) карты Марса на основе карты, сделанной USCS. Использовалась те же геологические данные, что и для оригинальной, но было добавлено больше топонимов и подписей, проведен редизайн визуального стиля, а термины из легенды карты упрощены для общего понимания.

Читать полностью »

Визуализация списка женщин-лауреатов Нобелевской премии в виде кристаллов в 3d с использованием Vue, WebGL, three.js

2020-06-13 в 19:11, admin, рубрики: Generative Art, geometry shader, glsl, javascript, scraping, shaders, vue, vuejs, WebGL, wikimedia api, визуализация данных, Работа с 3D-графикой

Год 1 | вдохновение

В этом месяце я очень долго пыталась определиться с датасетом и идеей для его обработки. Хотя я начала думать о нем еще в мае, по факту законить удалось только через 8 месяцев (черт, я плоха), а описать проект мне удалось еще спустя месяц (оу, я чертовски плоха).

Идея проекта пришла ко мне после просмотра фильма Безумно богатые азиаты. Мне очень понравилась актриса Мишель Йео, но идея оформилась только после того, как я прочитала больше о ней и узнала, насколько она была выдающейся и крутой. Это заставило меня задуматься выдающихся женщинах, о которых я понятия не имею. И вот — возникла идея как-то это визуализировать.
Читать полностью »

Подкаст: AR на стадионе, моделирование процессов реального мира и мультидисциплинарный геймдев

2020-05-24 в 12:07, admin, рубрики: AR, Андрей Карсаков, Блог компании Университет ИТМО, визуализация данных, геймдев, магистратура, моделирование процессов, разработка игр, Разработка под AR и VR, технология разработки игр, Университет ИТМО, Учебный процесс в IT

Это — подкаст «ITMO Research». Во втором выпуске с нами Андрей Карсаков, кандидат технических наук, старший научный сотрудник национального центра когнитивных разработок, доцент факультета цифровых трансформаций.

С 2012 года Андрей работает в научной группе Визуализация и компьютерная графика. Занимается крупными прикладными проектами на государственном и международном уровне. Мы говорим о его опыте участия в AR-сопровождении массовых мероприятий, визуализации данных, моделировании процессов реального мира и мультидисциплинарном геймдеве.

Читать полностью »

Сколько инструкций в x86?

2020-05-23 в 17:33, admin, рубрики: 80286, 80386, 8086, Broadwell, Cannon Lake, Haswell, i486, Ice Lake, Ivy Bridge, Knights Landing, Merom, Nehalem, Penryn, pentium, pentium ii, Pentium III, Pentium Pro, Prescott, Sandy Bridge, Skylake, Westmere, Willamette, визуализация данных, старое железо, Статистика в IT

vvvphoenix упомянул в своей позавчерашней статье: «Кстати, я пытался найти график роста числа X86 инструкций по годам (или по поколениям). Пока не смог (может, есть у кого?)»

Я решил, что мне это тоже интересно — да настолько, что не жалко потратить выходной день на сведение en.wikipedia.org/wiki/X86_instruction_listings в одну табличку:

Сколько инструкций в x86? - 1

Считались различные мнемоники; например, десятки вариантов MOV Читать полностью »

Как построить диаграмму Венна с 50 кругами? Визуализация множеств и история моего Python-проекта с открытым кодом

2020-05-19 в 8:07, admin, рубрики: open source, python, Алгоритмы, Блог компании Яндекс, визуализация данных, яндекс

Всем привет, меня зовут Фёдор Индукаев, я работаю аналитиком в Яндекс.Маршрутизации. Сегодня хочу рассказать вам про задачу визуализации пересекающихся множеств и про пакет для Python с открытым кодом, созданный мной для её решения. В процессе мы узнаем, чем различаются диаграммы Венна и Эйлера, познакомимся с сервисом распределения заказов и по касательной заденем такую область науки, как биоинформатика. Двигаться будем от простого к более сложному. Поехали!

Как построить диаграмму Венна с 50 кругами? Визуализация множеств и история моего Python-проекта с открытым кодом - 1

Читать полностью »

Кому на бюджете жить хорошо?

2020-05-14 в 2:37, admin, рубрики: python, анализ данных, бюджет, визуализация данных, госрасходы, открытые данные

Кому на бюджете жить хорошо? - 1

ВСТУПЛЕНИЕ

В каком году — рассчитывай,
В какой земле — угадывай,
На столбовой дороженьке
Сошлись семь мужиков:
Семь временнообязанных,
Подтянутой губернии,
Уезда Терпигорева,
Пустопорожней волости,
Из смежных деревень:
Заплатова, Дырявина,
Разутова, Знобишина.
Горелова, Неелова —
Неурожайка тож,
Сошлися — и заспорили:
Кому живется весело,
Вольготно на Руси?

Н.Некрасов

Пару месяцев назад на одном IT мероприятии мне довелось лицезреть в работе Pandas. Парень, который с ним работал не делал ничего особенно удивительного. Но простые сложения значений, вычисления средних, группировки проиводились так виртуозно, что, даже при всей своей предвзятости к Питону, я был очарован. Манипуляции выполнялись на довольно приличных датасетах по данным капитального ремонта за период кажется с 2004 по 2019 год. Сотни тысяч строк, но все работало очень быстро.

В общем когда мне еще через пару месяцев пришлось кое-что анализировать, я решил попробовать сделать это с помощью Pandas. Провозился пару дней с тем, что с помощью Excel я бы смог сделать за день. Тем не менее мне удалось.

С апреля мы все сидим на карантине. Сидел я и думал, что бы мне такое сделать, чтобы не очень сложное и чтобы стильно и модно было. К тому времени я уже видел кучу всякой инфографики про коронавирус, про пожары в лесу, про выборы. Делать то, что уже делали не хотелось, да и браться сразу за сложное не решался, сомневаясь, что смогу закончить. Тут мне попалась какая-то статья про уже отшумевшее явление "barchart race" или по-русски "гонки столбчатых диаграмм". Вы можете подумать, что эта статья будет про barchart race. Да, но только отчасти. Barchart race будет только в конце, а статья скорее о том, как не обладая, какими-то выдающимися способностями и знаниями в области матана и прочей черной магии, можно сделать анализ ~~больших~~ данных и представить результат в доступной для широких масс форме. Итак, поехали.

Читать полностью »

Большой туториал по обработке спортивных данных на python

2020-05-02 в 20:42, admin, рубрики: pandas, python, анализ данных, векторизация, визуализация данных, Восстановление данных, парсинг сайтов, скраппинг, спорт, статистика

Большой туториал по обработке спортивных данных на python - 1

Последние пару лет в свободное время занимаюсь триатлоном. Этот вид спорта очень популярен во многих странах мира, в особенности в США, Австралии и Европе. В настоящее время набирает стремительную популярность в России и странах СНГ. Речь идет о вовлечении любителей, не профессионалов. В отличие от просто плавания в бассейне, катания на велосипеде и пробежек по утрам, триатлон подразумевает участие в соревнованиях и системной подготовке к ним, даже не будучи профессионалом. Наверняка среди ваших знакомых уже есть по крайней мере один “железный человек” или тот, кто планирует им стать. Массовость, разнообразие дистанций и условий, три вида спорта в одном – все это располагает к образованию большого количества данных. Каждый год в мире проходит несколько сотен соревнований по триатлону, в которых участвует несколько сотен тысяч желающих. Соревнования проводятся силами нескольких организаторов. Каждый из них, естественно, публикует результаты у себя. Но для спортсменов из России и некоторых стран СНГ, команда tristats.ru собирает все результаты в одном месте – на своем одноименном сайте. Это делает очень удобным поиск результатов, как своих, так и своих друзей и соперников, или даже своих кумиров. Но для меня это дало еще и возможность сделать анализ большого количества результатов программно. Результаты опубликиваны на трилайфе: почитать.

Это был мой первый проект подобного рода, потому как лишь недавно я начал заниматься анализом данных в принципе, а также использовать python. Поэтому хочу рассказать вам о техническом исполнении этой работы, тем более что в процессе то и дело всплывали различные нюансы, требующие иногда особого подхода. Здесь будет про скраппинг, парсинг, приведение типов и форматов, восстановление неполных данных, формирование репрезентативной выборки, визуализацию, векторизацию и даже параллельные вычисления.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «визуализация данных» - 9

Что общего у научной визуализации данных и геймдева — обсуждаем в новом подкасте «ITMO Research_»

Хабрастатистика: как Хабр пережил самоизоляцию

Сколько инструкций процессора использует компилятор?

Красивая и подробная геологическая карта Марса, сделанная на Python, GDAL

Визуализация списка женщин-лауреатов Нобелевской премии в виде кристаллов в 3d с использованием Vue, WebGL, three.js

Год 1 | вдохновение

Подкаст: AR на стадионе, моделирование процессов реального мира и мультидисциплинарный геймдев

Сколько инструкций в x86?

Как построить диаграмму Венна с 50 кругами? Визуализация множеств и история моего Python-проекта с открытым кодом

Кому на бюджете жить хорошо?

ВСТУПЛЕНИЕ

Большой туториал по обработке спортивных данных на python

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «визуализация данных» - 9

Год 1 | вдохновение

ВСТУПЛЕНИЕ

Новости

Актуальные темы

Архив