Рубрика «визуализация данных» - 27

Google News и Лев Толстой: визуализация векторных представлений слов с помощью t-SNE

2018-12-14 в 9:51, admin, рубрики: big data, jupyter notebook, python, t-sne, word embedding, word2vec, Блог компании Mail.Ru Group, визуализация данных, машинное обучение

Google News и Лев Толстой: визуализация векторных представлений слов с помощью t-SNE - 1

Каждый из нас воспринимает тексты по-своему, будь это новости в интернете, поэзия или классические романы. То же касается алгоритмов и методов машинного обучения, которые, как правило, воспринимают тексты в математической в форме, в виде многомерного векторного пространства.

Статья посвящена визуализации при помощи t-SNE рассчитанных Word2Vec многомерных векторных представлений слов. Визуализация позволит полнее понять принцип работы Word2Vec и то, как следует интерпретировать отношения между векторами слов перед дальнейшем использованием в нейросетях и других алгоритмах машинного обучения. В статье акцентируется внимание именно на визуализации, дальнейшее исследование и анализ данных не рассматриваются. В качестве источника данных мы задействуем статьи из Google News и классические произведения Л.Н. Толстого. Код будем писать на Python в Jupyter Notebook.
Читать полностью »

Как Иван конверсию стендов исследовал

2018-12-05 в 15:26, admin, рубрики: devops, анализ, визуализация данных, дистрибутивы, команды, конверсия, метрики, причины, разработка, сборки, слащавые, стенды, управление, Управление продуктом, управление разработкой

После того как Иван познакомился с когортным анализом, он терпеть не мог любые виды слащавых метрик.

Но ирония была в том, что руководство не знало ничего другого, и знать категорически не хотело. Приходилось переступать через себя и тупо идти на встречу «просьбам» начальника, чтобы не заработать репутацию нехорошего человека, неподчиняющегося указаниям мудрецов.
Иногда из этого даже получались весьма интересные результаты. Об одном таком случае сейчас и пойдет речь.

Как-то руководитель попросил Ивана разобраться, почему в течение 3- недель непрерывно падает конверсия прохождения стенда командами:

Читать полностью »

Плагин «Rainbow CSV» как альтернатива Excel

2018-11-12 в 7:58, admin, рубрики: csv, regular expressions, syntax hightighting, text editors, TSV, визуализация данных, Программирование, Регулярные выражения

Привет! Эта статья про плагин Rainbow CSV, который я написал для 5 текстовых редакторов:

VS Code, Vim, Sublime Text 3, Atom, Gedit

Думаю, что многие читатели этой статьи периодически сталкиваются с CSV (comma-separated), ТSV (tab-separated) и подобными файлами. Если попробовать открыть их в текстовом редакторе (а как иначе узнать что там внутри?), то откроется совершенно невзрачная картина как с левой стороны изображения. Глядя на это сложно сказать даже сколько колонок в таблице. С правой стороны картинки тот же файл с включенным RainbowCSV, читаемость значительно повысилась за счет синтаксической подсветки.

Читать полностью »

Города и их «большие данные»

2018-10-30 в 9:39, admin, рубрики: big data, Блог компании Smile-Expo, Большие данные, визуализация данных, городская среда, смайл экспо, Урбанизм

О чем рассказывают «большие данные» города? Как представить их наглядно и — что важнее — как с их помощью сделать жизнь горожан лучше?

Об этом мы поговорили с Андреем Кармацким, гендиректором компании Urbica. Компания специализируется на визуализации городских данных. Среди ее проектов — редизайн карты для MAPS.ME, интерактивная визуализация статистики поездок для «Велобайка» и визуализация для запуска системы наземного городского транспорта «Магистраль».

Города и их «большие данные» - 1
Велосипедный трафик между районами в центре Москвы. Источник изображений — блог «Урбики» на Medium

Читать полностью »

Tableau от чайника или визуализация анализа ПАММ счетов

2018-10-30 в 6:09, admin, рубрики: dataviz, smalltalk, tableau, визуализация, визуализация данных

Друзья, добрый день.

Давно не писал, и тут подписался на рассылку компании Абвгд. Красивые письма пишут мОлодцы :) Уговаривают вложиться в ПАММ счета. Что это такое не знаю. Зато понятно, как эти данные анализировать.

Терминология – есть ПАММ-счет и у него есть управляющий. Буду использовать термин «ПАММ-счет» и «управляющий» — здесь это синонимы.

По теме хотелось сделать визуализацию в инструменте Tableau Public. Статьи об этом «в доступной для меня форме» не нашел. Она ниже.

План атаки:

Формулируем задачу,
Собираем данные,
Причёсываем,
Делаем несколько графиков,
Сводим на один дашборд,
Выкладываем на https://public.tableau.com
Формулируем резюме. Профит.

Задача

Работаю на работе работу. Получаю зарплату, аванс там или ещё что-то. Пусть деньги приходят еженедельно в ночь с воскресенья на понедельник. Хочу вложиться в высокодоходные активы, например в ПАММ счет. И вкладываться еженедельно понемногу.

Надо понимать, когда и куда вкладываться. Доходность нужна высокая, просадки должны быть минимальными.

Читать полностью »

Митап в Петербурге: Data Engineering и не только

2018-10-29 в 10:37, admin, рубрики: Apache Spark, big data, data, data mining, spark, wrike, wriketechclub, Блог компании Wrike, визуализация данных

Митап в Петербурге: Data Engineering и не только - 1

Дата инженеры — люди, без которых аналитики уснут до окончания запроса к БД, а дата сайентисты захлебнутся в данных. Пришло время рассказать окружающим и самим себе, зачем и как мы работаем.

К сожалению, чуть ли не единственная специализированная конференция для дата-аналитиков и дата-инженеров в Питере в этом году отменилась, но мы в Wrike Tech Club решили дольго не грустить и устроить ламповый уютный митап с классными спикерами.
Читать полностью »

31 октября, Москва — BI MeetUP

2018-10-22 в 10:03, admin, рубрики: BI, big data, Business Intelligence, data mining, oracle, Альфа-Банк, Блог компании «Альфа-Банк», визуализация данных, конференции, митап, транзакции, финтех

Привет! В этот раз мы сделали митап не для разработчиков или дизайнеров, а по менее популярной (но не менее важной) теме — BI, Business intelligence.

Ребята из BI занимаются тем, что переводят поток транзакционных данных в информацию, которую можно нормально анализировать и обрабатывать на последующих этапах работы.

Вход бесплатный, но надо заранее зарегистрироваться. Подробности — под катом.
Читать полностью »

В распределении простых чисел обнаружена дифракционная картина, примерно как у квазикристаллов

2018-10-22 в 8:19, admin, рубрики: апериодический порядок, Блог компании GlobalSign, визуализация данных, дифракция, квазикристаллы, криптография, математика, мозаика пенроуза, пики Брэгга, простые числа, теория чисел, химия

В марте 2016 года Роберт Дж. Лемке-Оливер и Каннан Соундарараджан из Стэнфордского университета открыли новый шаблон в распределении простых чисел. Оказалось, что простые числа специфически распределяются по числовому пространству. Подробнее см. перевод статьи «Структура и случайность простых чисел» на Хабре.

К изучению темы подключились специалисты из других областей, в том числе химии. И успешно. Профессор теоретической химии Сальваторе Торкуато вместе с теоретиком чисел Мэтью де Курси-Айрлэнд нашли новые шаблоны в распределении простых чисел, о которых раньше не было известно. Оказалось, что распределение простых чисел образует фракталоподобную дифракционную картину, чем-то похожую на картину дифракции у экзотических квазикристаллов.
Читать полностью »

10 трюков для продвинутого дашбординга в Splunk. Часть 1

2018-10-19 в 7:14, admin, рубрики: big data, Bootstrap, dashboard, html, splunk, usability, XML, Блог компании TS Solution, визуализация данных

10 трюков для продвинутого дашбординга в Splunk. Часть 1 - 1

Добрый день!

Сегодня мы хотим поделиться с вами инсайдом с ежегодного масштабного мероприятия Splunk .conf18, которое проходило в начале октября. Splunk .conf – это то место, где эксперты и разработчики Splunk делятся своим опытом, разными фишками и полезными инструментами для работы.

В двух статьях мы расскажем о 10 лайфхаках для разработчиков дашбордов, которые были предложены на конференции. Почему говорим именно про это? Потому что чем лучше выглядит приложение, тем лучше воспринимается информация в нем. Для того, чтобы сделать действительно хорошие дашборды уже существует множество встроенных или легко интегрируемых инструментов, правда далеко не все знают, где и как их найти. Подробнее про них и как их использовать, смотрите под катом.
Читать полностью »

Что было интереснго на DataVizDay в Минске

2018-10-17 в 7:17, admin, рубрики: data mining, dwh, анализ данных, визуализация данных, конференции, конференция, минск

В четверг 4 октября я побывал на конференции DataVizDay в Минске в качестве спикера. Поделюсь самыми интересными идеями и впечатлением от Миснка.

Ключевые идеи:

80% ваших усилий будет до BI и визуализации, потому что данные бывают или плохие или очень плохие и в основном вы будете тратить время на подготовку и сбор данных.
2.Тем не менее визуализация создает ценность вашего дата продукта. Без визуализации получается просто куча цифр.
К сожалению очень часто визуализация плохая, используют плохие подходы, типы графиков и гистограмм, перегружают представления деталями. В итоге часто мы видим Kill by powerpoint и обилие данные не добавляет прозрачности в аналитике.
Эксель продолжает занимать значительную роль в процессах. И часто компании не готовы перейти на что-то продвинутое. Но даже на экселе можно построить много чего интересного, потому что хорошая аналитика скорее начинается с чистоты и подготовки данных, а не с красивых дашбордов.Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «визуализация данных» - 27

Google News и Лев Толстой: визуализация векторных представлений слов с помощью t-SNE

Как Иван конверсию стендов исследовал

Плагин «Rainbow CSV» как альтернатива Excel

Города и их «большие данные»

Tableau от чайника или визуализация анализа ПАММ счетов

Митап в Петербурге: Data Engineering и не только

31 октября, Москва — BI MeetUP

В распределении простых чисел обнаружена дифракционная картина, примерно как у квазикристаллов

10 трюков для продвинутого дашбординга в Splunk. Часть 1

Что было интереснго на DataVizDay в Минске

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «визуализация данных» - 27

Новости

Актуальные темы

Архив