С ростом сложности ИТ-систем и задач аналитики изменяются требования и к возможностям инструментов. Для многих сценариев приоритетными становятся решения, которые могут работать как с историческими данными, так и с теми, которые обновляются в реальном времени. То есть аналитикам все чаще нужен инструмент, работающий на стыке возможностей транзакционных и аналитических (OLAP и OLTP) систем.
Рубрика «olap»
Как организовать анализ большого объема данных в реальном времени
2024-08-01 в 11:13, admin, рубрики: olap, oltp, tarantool, tarantool column store, архитектура, отказоустойчивостьАнализ больших данных в Excel: используем сводную таблицу для работы с BigQuery, Snowflake и ClickHouse
2022-11-27 в 10:30, admin, рубрики: big data, bigquery, clickhouse, data engineering, data mining, Excel, Google Cloud Platform, Microsoft SQL Server, olap, olap-кубы, Snowflake, sql, анализ данных, аналитика данных, данныеВсем привет! Меня зовут Сергей Коньков - я работаю архитектором в компании CloudReports. Сегодня я расскажу, как мы создали продукт, который помогает пользователям работать с данными и в какой-то мере соединяет два мира аналитики: Excel и облачные хранилища данных.
Задача
BigQuery и другие аналитические хранилища в сочетании с современными BI инструментами перевернули работу с данными за последние годы. Возможность обрабатывать терабайты информации за секунды, интерактивные дашборды в DataStudio и PowerBI, сделали работу очень комфортной.
Joker 2021: прошедшая Java-конференция и общая статистика
2021-10-30 в 18:33, admin, рубрики: jacoco, java, joker, jpa, jug.ru, kotlin, neo4j, olap, quarkus, scala, spring, конференцииОбзор рассказывает об увиденных и услышанных докладах, о полученных при этом впечатлениях и о произошедших изменениях в проведении конференции формата онлайн.
Читать полностью »
Как технология in-memory изменила бизнес-аналитику
2019-10-04 в 10:25, admin, рубрики: BI, big data, data mining, ERP-системы, olap, python, qlik, хранилища данныхПримерно 5 миллисекунд проходит от запроса до ответа, если данные хранятся на жестком диске. SSD отвечает в 300 раз быстрее — за 150 микросекунд. Оперативной памяти требуется в 300,000 раз меньше времени — лишь 15 наносекунд.*
Можно долго рассуждать о том, как бизнес-аналитика помогает финансам или логистике. Способов применить информацию много, все время появляются новые. Но принцип работы разных аналитических решений один и заключается он в том, чтобы соединить данные из разных источников и посмотреть на них вместе — то есть целиком.
Чтобы воспользоваться информацией из нескольких источников, нужно к ним подключиться и извлечь данные. Но данные создавались разными способами, с разной периодичностью и хранятся в разных форматах. Поэтому прежде, чем визуализировать данные или передать другим системам для дальнейшей обработки, их придется объединить с помощью каких-то математических операций — трансформировать.
Технология in-memory заключается в том, что для трансформации в оперативную память единовременно загружаются все данные из разных источников. После этого трансформацию можно выполнить «на лету», без запросов к диску. Например, кликом выбрать измерение и сразу получить график, который будет отображать значения показателей в нужном разрезе. Благодаря тому, что все данные уже в оперативной памяти, аналитическому приложению не нужно делать запросы к жесткому диску для получения новой информации.
Это вступление должно помочь мне рассказать о том, как и почему менялись технологии, лежащие в основе современных аналитических решений.Читать полностью »
Надстройка для Excel, облегчающая установку фильтров при работе с кубами (VBA)
2019-08-29 в 14:28, admin, рубрики: Analysis Services, big data, data mining, Excel, Microsoft SQL Server, office, olap, olap-кубы, pivot tables, sql server, ssas, vba, кубы, макрос, надстройка, расширение, сводные таблицыКак известно, из коробки Excel не позволяет устанавливать фильтры по списку значений для сводных таблиц, а это ведь такая нужная вещь! Как отфильтровать товары по сотне кодов, а потом по другой сотне? Есть, конечно, способы, но все это не то…
Или, например, установить для куба фильтр по измерению с датами, но не проставлять галочки на каждом дне/месяце/годе, а задать диапазон С… ПО ....
Еще достаточно часто требуются установки периодов по фиксированным шаблонам, типа текущий день/месяц/год. Для этих целей можно добавить наборы (в многомерной модели куба) или добавить специальные атрибуты в измерение (это не очень удобно, но в табличной модели куба наборов нет).
Мы запилили на VBA расширение, добавляющее на ленту панель Инструменты куба с волшебными кнопочками.
Читать полностью »
Операционные vs аналитические базы: колоночное vs построчное хранение данных
2019-03-06 в 8:39, admin, рубрики: Business Intelligence, ERP-системы, Google Cloud Platform, Microsoft SQL Server, olap, колоночные субд, сжатие данных, хранение данныхБазы данных можно реализовать с помощью Excel, GSheet или при помощи больших ORM систем. В своей практике бизнес-аналитика я сталкивался с разными решениями. А поскольку в бизнес-анализ я пришёл из финансов и аудита, то каждый раз встречая новую систему задавался вопросами — чем все они отличаются друг от друга и какие задачи решают? Некоторые ответы нашёл. В этой статье будет рассмотрено два основных назначения баз данных:
1 — учёт операций,
2 — анализ данных
Отличие DAX и MDX
2017-11-01 в 13:06, admin, рубрики: Analysis Services, big data, Business Intelligence, data mining, dax, MDX, Microsoft SQL Server, olap, olap-кубы, sql, sql server, многомерная модель, многомерные кубы, табличная модельМеня часто спрашивают об основных отличиях DAX и MDX или в целом о различии табличной и многомерной модели.
С точки зрения выражения или языка запросов, одно из наиболее важных различий лежит во внутренней основе обоих подходов.
В кубе, для адресации ячейки в пространстве, у нас есть понятие кортежа. Ось в кортеже устанавливает координаты. Если у нас есть единственный кортеж, то результат — содержание соответствующей ячейки в кубе. Поскольку у атрибутов куба есть элемент All, который служит значением по умолчанию (в большинстве случаев), если атрибут не был включен в кортеж, то мы выполняем агрегацию также, как если бы он там был. Например, следующий кортеж возвращает (агрегированный) объем продаж за 2013 год
(Date.Calendar.[Calendar Year].&[2013], Measures.[Internet Sales Amount])
Визуализация данных Ensemble Workflow с помощью InterSystems DeepSee
2017-09-08 в 4:27, admin, рубрики: deepsee, intersystems, olap, olap-кубы, Блог компании InterSystems
При автоматизации бизнес-процессов предприятия часть задач всё равно должен выполнять человек: это согласование различной информации, обогащение данных из аналоговых источников и многое другое. В интеграционной шине InterSystems Ensemble для решения данного класса задач есть подсистема Ensemble Workflow, позволяющая людям участвовать в автоматизированных бизнес-процессах. В результате работы подсистемы Ensemble Workflow накапливается большой объём информации о том кто и сколько выполнял поставленные задачи. В этой статье с использованием BI-технологии InterSystems DeepSee, про которую я недавно уже писал на Хабре мы проанализируем и визуализируем эту информацию.Читать полностью »
Дисциплина, точность, внимание к деталям, часть вторая
2017-05-15 в 11:18, admin, рубрики: Analysis Services, Average of Children, big data, cubes, data mining, data warehouse, MDX, Microsoft SQL Server, olap, sql, ssas, кубыВведение
В этой статье я продолжу рассказ о своем опыте работы с Microsoft Analysis Services. В дополнение к предыдущей статье, я хочу написать про нестандартные решения, которые были сделаны в последнем проекте. Эти решения более тесно сблизили меня с Microsoft Analysis Services, я стал больше его уважать и делать с его помощью то, что ранее мне казалось невероятным.
Читать полностью »
Как автоматически создать отчет о релизе
2017-04-11 в 12:16, admin, рубрики: business inteligence, jira, microsoft project server, olap, redmine, release notes, reports, sql, tfs, Блог компании EastBanc Technologies, коммуникации с заказчиками, управление проектами, управление разработкой, метки: release notesСегодня расскажем, как автоматизировать создание отчетной документации по релизу (release notes) на основе импорта данных из трекинговых систем TFS, Redmine и JIRA и из системы управления проектами Microsoft Project Server.
Статья будет интересна в первую очередь менеджерам IT-проектов.