Рубрика «большие данные и машинное обучение»

Нам нужен RAG, вам нужен RAG: как встроить LLM туда, где она не нужна

2024-12-08 в 6:27, admin, рубрики: llm, nlp, rag, база знаний, Большие данные, большие данные и машинное обучение, машинное обучение, разработка, языковые модели

Когда хайп захватывает умы, кажется, что любое техническое решение должно строиться вокруг новой модной технологии и что теперь-то мы ух заживем! Сегодня у нас на хайпе RAG (Retrieval-Augmented Generation), вчера — NFT, позавчера — блокчейн везде и всюду. Давайте попробуем разобраться, нужен ли RAG на самом деле, или это просто «новый блокчейн» и через год все набьют шишки и забудут о нем.

Читать полностью »

В поисках обеда: распознавание активности по данным фитнес-трекера

2020-06-22 в 7:01, admin, рубрики: big data, CleverDATA, data engineering, data mining, solut, Блог компании ГК ЛАНИТ, большие данные и машинное обучение, Ланит, машинное обучение

Мне посчастливилось участвовать в проекте SOLUT, который стартовал в ЛАНИТ около года назад. Проект развивается благодаря активному участию Центра компетенции больших данных ЛАНИТ (ЦК Дата), и главное технологическое новшество проекта заключается в использовании машинного обучения для мониторинга человеческой активности. Основным источником данных для нас являются сенсоры фитнес-трекеров, закрепленные на руках работников. В первую очередь, результаты распознавания помогают поднять производительность труда и оптимизировать производственные процессы на стройке. Также анализ поведения рабочих позволяет отслеживать самочувствие человека, соблюдение техники безопасности и напоминает строителям про обед.

В поисках обеда: распознавание активности по данным фитнес-трекера - 1

Источник
Читать полностью »

Как мозг бьет дерево, или как мы сделали рекомендательную систему с помощью нейронной сети

2017-11-12 в 8:12, admin, рубрики: big data, Блог компании QIWI, большие данные и машинное обучение, машинное обучение, нейронные сети, рекомендательные системы

Как бы вы сделали рекомендательную систему? У многих в голове сразу появилась картина как они импортят и стакают ~~XGBoost~~ CatBoost. Изначально у нас в голове появилась та же картина, но мы решили на волне хайпа сделать это на нейронных сетях, благо времени было много. Опыт их создания, тестирование, результаты и наши мысли описаны далее.

Как мозг бьет дерево, или как мы сделали рекомендательную систему с помощью нейронной сети - 1

Читать полностью »

Кто владеет данными, генерируемыми устройствами из интернета вещей?

2017-07-05 в 15:26, admin, рубрики: big data, IoT, Parallels, Блог компании Parallels, Большие данные, большие данные и машинное обучение, Интернет вещей, Исследования и прогнозы в IT, Читальный зал

Кто владеет данными, генерируемыми устройствами из интернета вещей? - 1

Сегодня многие организации начинают передавать свои IoT-данные сторонним компаниям. Зачастую это делается ради монетизации, иногда — для соблюдения требований регуляторов. И все эти инициативы выдвигают на передний план проблемы владения данными и их лицензирования.

Любопытно, что не существует установленной схемы определения, как присваивается право собственности, и ещё хуже обстоят дела с правильным лицензированием IoT-данных. Давайте рассмотрим ситуацию чуть подробнее.Читать полностью »

Как наука о данных помогает развитию медицины. Лекция в Яндексе

2017-06-04 в 12:09, admin, рубрики: DeepMind, ibm watson, Блог компании Яндекс, большие данные и машинное обучение, генетика, генетические алгоритмы, геном, гигапиксельные изображения, диагностика болезней, Исследования и прогнозы в IT, носимые устройства, сбор данных, телемедицина, фитнес-трекеры, электронная медицина

Постепенная информатизация медицины связана со сбором очень разных данных. Они добываются совершенно непохожими способами и почти всегда имеют уникальную структуру. Откуда, как и зачем их стоит собирать? В своём докладе руководитель разработки сервиса Яндекс.Здоровье Михаил Tomcat Пайсон рассказывает об основных путях развития современной медицины и о технологических проблемах, которые перед ней стоят.

Под катом — расшифровка доклада и слайды.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «большие данные и машинное обучение»

Нам нужен RAG, вам нужен RAG: как встроить LLM туда, где она не нужна

Читать полностью »

В поисках обеда: распознавание активности по данным фитнес-трекера

Как мозг бьет дерево, или как мы сделали рекомендательную систему с помощью нейронной сети

Кто владеет данными, генерируемыми устройствами из интернета вещей?

Как наука о данных помогает развитию медицины. Лекция в Яндексе