Рубрика «big data» - 2

Язык Julia: что это и почему он популярен в научных вычислениях

2025-05-19 в 6:15, admin, рубрики: big data, C, hf, python, инструменты, производительность, работа в it

Согласно индексу TIOBE, Julia входит в топ-50 самых актуальных языков программирования в 2025 году и занимает в рейтинге 34-ю строчку.

Julia получил признание благодаря универсальности, скорости, понятному синтаксису и множеству других достоинств, о которых мы расскажем в статье. Этот идеальный вариант для научных вычислений в любых отраслях — от анализа огромных массивов данных до расчетов прочности архитектурных объектов.

Читать полностью »

DBT: трансформация данных без боли

2025-05-07 в 7:15, admin, рубрики: big data, data ingineering, dataops, dbt, elt, sql, аналитика данных, трансформация данных

Привет! Меня зовут Кирилл Львов, я fullstack-разработчик в компании СберАналитика. В этой статье хочу рассказать про мощный инструмент трансформации данных — DBT (Data Build Tool).

Читать полностью »

История исследования и анализа информации. Архитектура Data Mesh: концептуальные основы

2025-04-24 в 4:15, admin, рубрики: big data, data engineering, data mesh, DDD, etl, smart data

С возникновением первых вычислительных машин предприятия осознали потребность в обработке и анализе информации.

В 1980-е годы они приступили к формированию информационных хранилищ, основанных на реляционных базах данных, которые стали ключевым инструментом для принятия взвешенных решений.

Но по мере того как компании накапливали всё больше разнородных сведений, недостатки реляционных баз данных становились всё более явными.

С началом нового тысячелетия мы вступили в эпоху больших данных.Читать полностью »

Куда расти Data Scientist и какие навыки для этого нужны

2025-02-24 в 12:00, admin, рубрики: big data, data science, карьера ИТ-специалиста, Учебный процесс в IT

Привет! Меня зовут Никита Зелинский, я Chief Data Scientist МТС, руководитель центра компетенций Data Science и ML-платформ МТС Big Data. На конференциях я часто слышу один и тот же вопрос от начинающих дата-сайентистов: как развиваться в своей сфере и прийти к успеху? Тут сразу напрашивается одно сравнение — рост в профессии напоминает тренировки в качалке. Чтобы добиться результата, нужен четкий план: что конкретно и когда прокачивать. Вот и в работе важно понимать, какие навыки развивать и как составить стратегию роста — от стажера до ведущего специалиста или Chief Data Scientist.

Читать полностью »

Миллиарды векторов и немного магии: превращаем сырые данные с маркетплейсов в пригодные для анализа

2025-02-21 в 5:59, admin, рубрики: big data, faiss, аналитика, искусственный интеллект, маркетплейсы, нейросети, обработка изображений, семантический поиск, эмбеддинги

Привет! Я — Игорь Старун, BigData Lead в MPSTATS. Я уже 3 года занимаюсь анализом данных на маркетплейсах, штудируя гигантские объёмы информации и превращая их из непотребного и нечитаемого вида в удобоваримый и анализируемый. Моя задача — собрать и подготовить данные так, чтобы помочь продавцам на маркетплейсах разобраться, что происходит с их товарами, конкурентами и продажами, чтобы они не утонули в хаосе карточек, цен и остатков. В этой статье я расскажу, как мы перерабатываем эти объемы грязных данных и структурируем для дальнейшего анализа.

Данные о товарах – это основа всего.Читать полностью »

Удивительный мир хакатонов: как я придумал для студентов задачку и что они с ней натворили

2025-02-06 в 11:54, admin, рубрики: big data, Большие данные, искуственный интеллект, командная работа, машинное обучение, мтс линк, хакатон

Привет! Меня зовут Владимир Казаков, я руковожу продуктом «Обучение» в МТС Линк. А еще я с удовольствием помогаю организовывать и проводить хакатоны — это всегда десятки свежих идей, передающийся от участников драйв, новые контакты и море опыта для будущих разработчиков. Полгода назад в наш рабочий чат внезапно прилетело сообщение: «Ребят, срочно! МИФИ организуют хакатон, нужна задача, желательно отправить сегодня!». Вызов был принят, и мы подготовили задание по работе с большими данными. В этом посте расскажу, чем студенты могут удивить разработчика с 15-летним стажем, в чем их сильные стороны, а что еще надо подтянуть. Читать полностью »

Инновационная Столица-2024: единый центр BI для всего ТК, социология будущего, оптимизация работы контролеров

2025-01-17 в 12:50, admin, рубрики: BI, big data, big data analytics, безопасный транспорт, данные, инновации, инновации в it, инновации в технологиях, разработка

Привет! Я Ося разработчик. Сегодня я продолжу делиться проектами и решениями, представленными на нашем ярком мероприятии Инновационная Столица-2024. Познакомиться с проектами из первой части события можно по ссылке.

Единый центр BI для всего Транспортного комплекса

Читать полностью »

Подходы к архитектуре и принципам проектирования хранилищ данных

2025-01-16 в 9:15, admin, рубрики: big data, big data analytics, big data и хранение данных, big data технологии

Основные подходы к архитектуре

Многомерная схема специально разработана для моделирования систем хранилищ данных. Схемы предназначены для удовлетворения уникальных потребностей очень больших баз данных, разработанных для аналитических целей OLAP.

Модель звезды (Star Schema)
Модель снежинки (Snowflake Schema)
Читать полностью »

Инновационная Столица-2024: ИЦ рассказал о вызовах и достижениях в работе над проектами по цифровизации

2025-01-09 в 12:14, admin, рубрики: BI, big data, безопасный транспорт, инновации, московский транспорт, технологии, технологии будущего, транспорт, транспорт будущего

Инновационная столица-2024 — торжественное мероприятие, посвященное презентации ключевых кейсов и продуктов ИЦ «Безопасный транспорт», состоялось 13 декабря в павильоне «Умный город» на ВДНХ.

Инновационная столица - ежегодное событие, на котором гости могут заглянуть в закулисье Инновационного центра и ЦОДД и узнать про значимые цифровые проекты, которые создаются для Транспортного комплекса Москвы.

Читать полностью »

Как оценивать ваш RAG-пайплайн и валидировать качество ответов LLM

2024-12-27 в 6:14, admin, рубрики: AI, big data, llm, llm-модели, nlp, rag, rag pipeline, база знаний, искусственный интеллект, языковые модели

RAG-системы становятся все популярнее в корпоративной среде, но их эффективное внедрение и качественная оценка остается сложной задачей. Один из типичных примеров — создание чат-ботов, отвечающих на вопросы пользователей с опорой на корпоративную базу знаний. И которые, вроде бы, заводятся и работают, и делают это даже неплохо, но всегда хочется получше.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «big data» - 2

Язык Julia: что это и почему он популярен в научных вычислениях

DBT: трансформация данных без боли

История исследования и анализа информации. Архитектура Data Mesh: концептуальные основы

Куда расти Data Scientist и какие навыки для этого нужны

Миллиарды векторов и немного магии: превращаем сырые данные с маркетплейсов в пригодные для анализа

Удивительный мир хакатонов: как я придумал для студентов задачку и что они с ней натворили

Инновационная Столица-2024: единый центр BI для всего ТК, социология будущего, оптимизация работы контролеров

Подходы к архитектуре и принципам проектирования хранилищ данных

Основные подходы к архитектуре

Инновационная Столица-2024: ИЦ рассказал о вызовах и достижениях в работе над проектами по цифровизации

Как оценивать ваш RAG-пайплайн и валидировать качество ответов LLM