Привет! Меня зовут Владимир Казаков, я руковожу продуктом «Обучение» в МТС Линк. А еще я с удовольствием помогаю организовывать и проводить хакатоны — это всегда десятки свежих идей, передающийся от участников драйв, новые контакты и море опыта для будущих разработчиков. Полгода назад в наш рабочий чат внезапно прилетело сообщение: «Ребят, срочно! МИФИ организуют хакатон, нужна задача, желательно отправить сегодня!». Вызов был принят, и мы подготовили задание по работе с большими данными. В этом посте расскажу, чем студенты могут удивить разработчика с 15-летним стажем, в чем их сильные стороны, а что еще надо подтянуть. Читать полностью »
Рубрика «big data»
Удивительный мир хакатонов: как я придумал для студентов задачку и что они с ней натворили
2025-02-06 в 11:54, admin, рубрики: big data, Большие данные, искуственный интеллект, командная работа, машинное обучение, мтс линк, хакатонИнновационная Столица-2024: единый центр BI для всего ТК, социология будущего, оптимизация работы контролеров
2025-01-17 в 12:50, admin, рубрики: BI, big data, big data analytics, безопасный транспорт, данные, инновации, инновации в it, инновации в технологиях, разработкаПривет! Я Ося разработчик. Сегодня я продолжу делиться проектами и решениями, представленными на нашем ярком мероприятии Инновационная Столица-2024. Познакомиться с проектами из первой части события можно по ссылке.
Единый центр BI для всего Транспортного комплекса
Подходы к архитектуре и принципам проектирования хранилищ данных
2025-01-16 в 9:15, admin, рубрики: big data, big data analytics, big data и хранение данных, big data технологииОсновные подходы к архитектуре
Многомерная схема специально разработана для моделирования систем хранилищ данных. Схемы предназначены для удовлетворения уникальных потребностей очень больших баз данных, разработанных для аналитических целей OLAP.
-
Модель звезды (Star Schema)
-
Модель снежинки (Snowflake Schema)
Инновационная Столица-2024: ИЦ рассказал о вызовах и достижениях в работе над проектами по цифровизации
2025-01-09 в 12:14, admin, рубрики: BI, big data, безопасный транспорт, инновации, московский транспорт, технологии, технологии будущего, транспорт, транспорт будущегоИнновационная столица-2024 — торжественное мероприятие, посвященное презентации ключевых кейсов и продуктов ИЦ «Безопасный транспорт», состоялось 13 декабря в павильоне «Умный город» на ВДНХ.
Инновационная столица - ежегодное событие, на котором гости могут заглянуть в закулисье Инновационного центра и ЦОДД и узнать про значимые цифровые проекты, которые создаются для Транспортного комплекса Москвы.
Как оценивать ваш RAG-пайплайн и валидировать качество ответов LLM
2024-12-27 в 6:14, admin, рубрики: AI, big data, llm, llm-модели, nlp, rag, rag pipeline, база знаний, искусственный интеллект, языковые модели![Все работают на RAG Все работают на RAG](https://www.pvsm.ru/images/2024/12/27/kak-ocenivat-vash-RAG-paiplain-i-validirovat-kachestvo-otvetov-LLM.jpg)
RAG-системы становятся все популярнее в корпоративной среде, но их эффективное внедрение и качественная оценка остается сложной задачей. Один из типичных примеров — создание чат-ботов, отвечающих на вопросы пользователей с опорой на корпоративную базу знаний. И которые, вроде бы, заводятся и работают, и делают это даже неплохо, но всегда хочется получше.
Как предсказать будущее с помощью ML?
2024-12-27 в 5:15, admin, рубрики: AI, big data, machinelearning, ml, qicПривет, я Исламбек Темирбек, Senior Data Analyst в QIC digital hub. В этой статье я расскажу о машинном обучении и о том, как с его помощью можно предсказать будущее.
Какую роль играет аналитика в создании и разработке онлайн-страховых и нестраховых сервисов и почему мы обратились именно к машинному обучению (ML)? В этой статье я расскажу о нашем опыте с моделью машинного обучения Time Series, служащей для предсказания временных рядов. Обсудим, как мы использовали Facebook Prophet для прогнозирования продления полисов, а также методологию и результаты, включая возможные ошибки.
Как LLM меняют архитектуру систем: от простых дата-пайплайнов к интеллектуальным автономным агентам
2024-12-22 в 6:23, admin, рубрики: big data, data, data en, llm, llm-приложения, machine learning, nlp, агентыНа каждой технической конференции в последнее время обязательно звучит слово «агенты». Они преподносятся по разному: и как следующая ступенька после RAG, и как серебряная пуля для всех проблем, и как абсолютная замена всех классических пайплайнов. А кто еще не использует агентов — безнадежно отстал от прогресса.
![Классика, LLM-ассистент и LLM-агент Классика, LLM-ассистент и LLM-агент](https://www.pvsm.ru/images/2024/12/22/kak-LLM-menyayut-arhitekturu-sistem-ot-prostyh-data-paiplainov-k-intellektualnym-avtonomnym-agentam.jpg)
Повышение производительности складской комплектации: как без трудоёмкого хронометража найти потенциал ускорения
2024-12-11 в 9:10, admin, рубрики: big data, Process Intelligence, Task mining, Большие данные, исследование, логистика, повышение производительности, цепочки поставок, цифровой след, эффективностьТекущая экономическая ситуация в мире приводит к сильному давлению роста цен во всех секторах экономики. Ритейлеры не могут перекладывать эти риски на плечи своих покупателей, что приводит их к необходимости поиска новых путей сокращения затрат на экземпляр процесса, т. е. на штуку товара. Усиливающаяся конкуренция с e‑commerce требует перестройки процессов и выхода на повышенные скорости доставки в борьбе за клиента.
Элегантная математика фильтров Блума
2024-12-08 в 9:13, admin, рубрики: big data, ruvds_переводы, Большие данные, математика, фильтры блума![Элегантная математика фильтров Блума - 1 Элегантная математика фильтров Блума - 1](https://www.pvsm.ru/images/2024/12/09/elegantnaya-matematika-filtrov-bluma.png)
Вероятностные функции способны моделировать множество алгоритмов и процедур. Они помогают нам оптимизировать процессы для получения наилучших результатов. Опытные программные инженеры знают, что рано или поздно практически любое ПО достигает определённой степени недетерминированности, когда решение является не абсолютным, но при оптимальной конфигурации приближается к наилучшим результатам. В математическом смысле подобное решение обычно сводится к поиску минимума, максимума или пределов неких вероятностных функций.
В этой статье речь пойдёт об изяществе математики, лежащей в основе фильтров Блума. Мы разберём аспекты точности работы и компромиссов при конфигурировании этих фильтров, а также узнаем, почему в некоторых случаях они могут стать отличным выбором, особенно в сфере больших данных и системах OLAP, когда подразумевается обработка огромных и статичных датасетов.Читать полностью »
Как мы отбираем и обучаем разметчиков: от первых шагов до реальных проектов
2024-10-25 в 9:02, admin, рубрики: artificial intelligence, big data, data annotation, project management, аннотация, разметка данных, разметка датасета![Как мы отбираем и обучаем разметчиков: от первых шагов до реальных проектов - 1 Как мы отбираем и обучаем разметчиков: от первых шагов до реальных проектов - 1](https://www.pvsm.ru/images/2024/10/25/kak-my-otbiraem-i-obuchaem-razmetchikov-ot-pervyh-shagov-do-realnyh-proektov.png)
В чем секрет качественных данных и точной разметки? Мы в Data Light знаем: за каждым успешным проектом стоят не только технологии, но и люди — специалисты, отобранные после нескольких этапов тестирований и обученные на настоящих проектах.