Когда хайп захватывает умы, кажется, что любое техническое решение должно строиться вокруг новой модной технологии и что теперь-то мы ух заживем! Сегодня у нас на хайпе RAG (Retrieval-Augmented Generation), вчера — NFT, позавчера — блокчейн везде и всюду. Давайте попробуем разобраться, нужен ли RAG на самом деле, или это просто «новый блокчейн» и через год все набьют шишки и забудут о нем.
Рубрика «большие данные и машинное обучение»
Нам нужен RAG, вам нужен RAG: как встроить LLM туда, где она не нужна
2024-12-08 в 6:27, admin, рубрики: llm, nlp, rag, база знаний, Большие данные, большие данные и машинное обучение, машинное обучение, разработка, языковые моделиВ поисках обеда: распознавание активности по данным фитнес-трекера
2020-06-22 в 7:01, admin, рубрики: big data, CleverDATA, data engineering, data mining, solut, Блог компании ГК ЛАНИТ, большие данные и машинное обучение, Ланит, машинное обучениеМне посчастливилось участвовать в проекте SOLUT, который стартовал в ЛАНИТ около года назад. Проект развивается благодаря активному участию Центра компетенции больших данных ЛАНИТ (ЦК Дата), и главное технологическое новшество проекта заключается в использовании машинного обучения для мониторинга человеческой активности. Основным источником данных для нас являются сенсоры фитнес-трекеров, закрепленные на руках работников. В первую очередь, результаты распознавания помогают поднять производительность труда и оптимизировать производственные процессы на стройке. Также анализ поведения рабочих позволяет отслеживать самочувствие человека, соблюдение техники безопасности и напоминает строителям про обед.
Как мозг бьет дерево, или как мы сделали рекомендательную систему с помощью нейронной сети
2017-11-12 в 8:12, admin, рубрики: big data, Блог компании QIWI, большие данные и машинное обучение, машинное обучение, нейронные сети, рекомендательные системыКак бы вы сделали рекомендательную систему? У многих в голове сразу появилась картина как они импортят и стакают XGBoost CatBoost. Изначально у нас в голове появилась та же картина, но мы решили на волне хайпа сделать это на нейронных сетях, благо времени было много. Опыт их создания, тестирование, результаты и наши мысли описаны далее.
Кто владеет данными, генерируемыми устройствами из интернета вещей?
2017-07-05 в 15:26, admin, рубрики: big data, IoT, Parallels, Блог компании Parallels, Большие данные, большие данные и машинное обучение, Интернет вещей, Исследования и прогнозы в IT, Читальный зал
Сегодня многие организации начинают передавать свои IoT-данные сторонним компаниям. Зачастую это делается ради монетизации, иногда — для соблюдения требований регуляторов. И все эти инициативы выдвигают на передний план проблемы владения данными и их лицензирования.
Любопытно, что не существует установленной схемы определения, как присваивается право собственности, и ещё хуже обстоят дела с правильным лицензированием IoT-данных. Давайте рассмотрим ситуацию чуть подробнее.Читать полностью »
Как наука о данных помогает развитию медицины. Лекция в Яндексе
2017-06-04 в 12:09, admin, рубрики: DeepMind, ibm watson, Блог компании Яндекс, большие данные и машинное обучение, генетика, генетические алгоритмы, геном, гигапиксельные изображения, диагностика болезней, Исследования и прогнозы в IT, носимые устройства, сбор данных, телемедицина, фитнес-трекеры, электронная медицинаПостепенная информатизация медицины связана со сбором очень разных данных. Они добываются совершенно непохожими способами и почти всегда имеют уникальную структуру. Откуда, как и зачем их стоит собирать? В своём докладе руководитель разработки сервиса Яндекс.Здоровье Михаил Tomcat Пайсон рассказывает об основных путях развития современной медицины и о технологических проблемах, которые перед ней стоят.
Под катом — расшифровка доклада и слайды.