Рубрика «Большие данные»

Масштабный анализ данных астрометрического обзора Gaia DR3

2025-12-23 в 11:16, admin, рубрики: gaia, Gaia DR3, астрометрия, Большие данные, фотометрия

Анализ Gaia DR3 — комбинированная версия

Введение

Gaia — это космическая обсерватория Европейского космического агентства (ESA), запущенная в декабре 2013 года. Основная цель миссии — максимально точно измерить положения, расстояния и движения звёзд в нашей Галактике. Фактически Gaia создаёт трёхмерную карту Млечного Пути.

К январю 2025 года научная программа миссии была завершена. За это время Gaia выполнила несколько релизов данных, крупнейшим из которых на данный момент является Gaia Data Release 3 (DR3). Этот релиз содержит информацию примерно о 1,8 миллиарда астрономических объектовЧитать полностью »

Язык и большие данные

2025-12-03 в 13:13, admin, рубрики: Большие данные, лингвистика, нейросети, новые слова, язык

Язык всегда строился на интуиции носителей, а его изучение зависело от интроспекции лингвистов. Теперь же большие данные кардинально меняют эту систему.

Читать полностью »

Вам куда? История Uber

2025-10-19 в 5:58, admin, рубрики: BigData, uber, автономия, Алгоритмы, беспилотный автомобиль, Большие данные, доставка еды, такси, шеринг-экономика, экосистема

Нажми кнопку — и поезжай. Эта идея стала началом того, что впоследствии изменило облик городского транспорта, бросило вызов регуляторам по всему миру и превратило Uber в глагол, узнаваемый по всему земному шару.

Сегодня экосистема Uber перевозит не только людей, но и еду, продукты и товары, объединяя миллионы партнёров-водителей и сотни миллионов клиентов — в десятках миллиардов поездок.

От дерзкого нарушителя правил до интегрированного партнёра — таков путь Uber.

Такси до Uber

Читать полностью »

PostgreSQL против 10 миллионов записей: оптимизация запросов, которая спасла наш проект

2025-10-03 в 14:16, admin, рубрики: BigData, explain analyze, postgresql, sql, базы данных, Большие данные, индексирование, индексы, оптимизация запросов, производительность

PostgreSQL против 10 миллионов записей: оптимизация запросов, которая спасла наш проект

Пролог: Когда база данных говорит «нет»

Это был обычный понедельник. Я пил кофе, проверял почту, и вдруг — волна уведомлений в Slack. «Сайт не грузится!», «Отчеты зависли!», «Что происходит?».

Читать полностью »

Apache Superset — почему все топы рынка выбрали именно его?

2025-08-22 в 13:59, admin, рубрики: Apache, BI, superset, Большие данные, визуализация

1. Введение

Рынок BI-инструментов, как и любой другой сильно меняется в последние годы. Все чаще фокус компаний смещается в сторону open-source инструментов по понятным причинам. В этом мире высокая конкуренция - DataLens, Superset, Metabase и т.д. Есть хорошая статья с базовыми сравнениями BI-систем. Прекрасно, чтобы вкатится. Но невозможно в рамках одной статьи рассмотреть преимущества и недостатки каждой BI-системы. Поэтому мы пойдем немного другим путем - посмотрим на то, что выбирают топы рынка РФ, а затем кратко Читать полностью »

Ленивые вычисления в PHP: как генераторы и итераторы экономят память и ускоряют код

2025-08-22 в 12:15, admin, рубрики: iterator, php, yield, Большие данные, генераторы, итераторы, ленивые вычисления, оптимизация, память, производительность

Вы когда-нибудь пытались загрузить в память CSV-файл на миллион строк и увидели что-то вроде:

PHP Fatal error:  Allowed memory size of 134217728 bytes exhausted

Даже если увеличить memory_limit, ощущение всё равно неприятное: мы держим в памяти весь массив данных, хотя работаем с ним построчно.

Решение? Ленивые вычисления — подход, при котором данные генерируются и обрабатываются только тогда, когда они реально нужны.
В PHP это можно сделать двумя способами: с помощью генераторов (yield) и через Iterator API. Сегодня разберём оба.

Что такое ленивые вычисления

Читать полностью »

Смартфон не прослушивает вас в фоновом режиме. Истина куда страшнее

2025-04-25 в 18:33, admin, рубрики: Большие данные, большой брат, контекстная реклама, наблюдение, прослушивание, прослушивание телефонных разговоров, прослушка, прослушка телефонов, слежка, социальные сети

Почему соцсети показывают рекламу так, словно читают мысли? Как случайная фраза превращается в недели демонстрируемого контента? Действительно ли «Большой брат» следит за каждым? Забегая наперед: ваш смартфон вас не прослушивает. Ему это и не надо. Истина оказалась куда хуже, чем в сценарии романа-антиутопии.

Читать полностью »

Цифровая карта аварийности: как технологии помогают сделать дороги безопаснее

2025-03-07 в 15:56, admin, рубрики: аналитика данных, архитектура системы, безопасность, Большие данные, большие объемы данных, картографические сервисы, сервисы, технологии, транспорт

Привет! Буквально недавно в ИЦ прошло ежегодное мероприятие “Инновационная столица-2024”, где мой коллега, руководитель отдела цифровых сервисов, продемонстрировал обновленный АИС “Мониторинг аварийности”.

Цифровая карта ДТП не имеет аналогов в России, поэтому в этой статье я бы хотел рассказать, чем так уникален продукт, и как он помогает снижать количество ДТП в городе.

Для чего был создан сервис

Читать полностью »

Удивительный мир хакатонов: как я придумал для студентов задачку и что они с ней натворили

2025-02-06 в 11:54, admin, рубрики: big data, Большие данные, искуственный интеллект, командная работа, машинное обучение, мтс линк, хакатон

Привет! Меня зовут Владимир Казаков, я руковожу продуктом «Обучение» в МТС Линк. А еще я с удовольствием помогаю организовывать и проводить хакатоны — это всегда десятки свежих идей, передающийся от участников драйв, новые контакты и море опыта для будущих разработчиков. Полгода назад в наш рабочий чат внезапно прилетело сообщение: «Ребят, срочно! МИФИ организуют хакатон, нужна задача, желательно отправить сегодня!». Вызов был принят, и мы подготовили задание по работе с большими данными. В этом посте расскажу, чем студенты могут удивить разработчика с 15-летним стажем, в чем их сильные стороны, а что еще надо подтянуть. Читать полностью »

Цифровая трансформация как основа непрерывного улучшения производства

2025-01-22 в 14:07, admin, рубрики: glowbyte, IIoT, internet of things, Большие данные, индустрия 4.0, Интернет вещей, промышленный интернет вещей, цифровая трансформация, цифровое производство, цифровой помощник

Всем привет! Сегодня в эфире – Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «Большие данные»

Масштабный анализ данных астрометрического обзора Gaia DR3

Анализ Gaia DR3 — комбинированная версия

Введение

Язык и большие данные

Вам куда? История Uber

Такси до Uber

PostgreSQL против 10 миллионов записей: оптимизация запросов, которая спасла наш проект

PostgreSQL против 10 миллионов записей: оптимизация запросов, которая спасла наш проект

Пролог: Когда база данных говорит «нет»

Apache Superset — почему все топы рынка выбрали именно его?

1. Введение

Ленивые вычисления в PHP: как генераторы и итераторы экономят память и ускоряют код

Что такое ленивые вычисления

Смартфон не прослушивает вас в фоновом режиме. Истина куда страшнее

Цифровая карта аварийности: как технологии помогают сделать дороги безопаснее

Для чего был создан сервис

Удивительный мир хакатонов: как я придумал для студентов задачку и что они с ней натворили

Цифровая трансформация как основа непрерывного улучшения производства