Рубрика «CleverDATA»

ТОП-10 трендов в сфере данных и аналитики 2021. Версия Gartner

2021-06-15 в 7:02, admin, рубрики: big data, CleverDATA, gartner, Блог компании ГК ЛАНИТ, искусственный интеллект, Ланит, машинное обучение, перевод

Оракул технологического мира Gartner регулярно и охотно делится с обществом своими наблюдениями относительно текущих трендов. Эксперты компании составили подборку из 10 трендов в сфере данных и аналитики, которые стоит учитывать ИТ-лидерам в 2021 году – от искусственного интеллекта до малых данных и применения графовых технологий.

Материал Gartner является отличной пищей к размышлению, а в некоторых случаях он может сыграть важную роль при принятии стратегических решений. Для того, чтобы оставаться в курсе основных трендов и в то же время не тратить ресурсы на собственный анализ, уберечься от ошибок субъективного мнения, удобно пользоваться предоставленным отчетом, перевод которого и предлагается в этой статье.

ТОП-10 трендов в сфере данных и аналитики 2021. Версия Gartner - 1

Источник
Читать полностью »

Прикручиваем ИИ: оптимизация работы банкоматов

2021-04-20 в 7:01, admin, рубрики: CleverDATA, python, Алгоритмы, банкоматы, Блог компании ГК ЛАНИТ, Большие данные, Ланит, математика, машинное обучение

Всем привет! Это небольшой рассказ про то, как команда Центра компетенции больших данных и искусственного интеллекта в ЛАНИТ оптимизировала работу банкоматной сети. Упор в статье сделан не на описание подбора параметров и выбор лучшего алгоритма прогнозирования, а на рассмотрение концепции нашего подхода к решению поставленной задачи. Кому интересно, добро пожаловать под кат.

Прикручиваем ИИ: оптимизация работы банкоматов - 1

источник
Читать полностью »

Уроки волшебства для кота, дейтинг для беременных и астрология

2020-08-25 в 8:02, admin, рубрики: big data, CleverDATA, data mining, Блог компании ГК ЛАНИТ, Ланит, машинное обучение

Data Scientists узнают, что интересует людей и на что они тратят деньги

В ходе исследований различных аудиторий Data Scientists наблюдают как закономерные, так и удивительные факты, которые ярко характеризуют социум вокруг нас. В этой статье я расскажу о тех курьёзах и необычных случаях, которые заметила при выполнении задач, связанных с аудиторным анализом, исследованием интересов пользователей Интернета и покупательского поведения различных социальных групп.

Какие социологические особенности удалось выяснить благодаря применению моделей машинного обучения? Что мы знаем о покупателях?

Уроки волшебства для кота, дейтинг для беременных и астрология - 1

Источник
Читать полностью »

В поисках обеда: распознавание активности по данным фитнес-трекера

2020-06-22 в 7:01, admin, рубрики: big data, CleverDATA, data engineering, data mining, solut, Блог компании ГК ЛАНИТ, большие данные и машинное обучение, Ланит, машинное обучение

Мне посчастливилось участвовать в проекте SOLUT, который стартовал в ЛАНИТ около года назад. Проект развивается благодаря активному участию Центра компетенции больших данных ЛАНИТ (ЦК Дата), и главное технологическое новшество проекта заключается в использовании машинного обучения для мониторинга человеческой активности. Основным источником данных для нас являются сенсоры фитнес-трекеров, закрепленные на руках работников. В первую очередь, результаты распознавания помогают поднять производительность труда и оптимизировать производственные процессы на стройке. Также анализ поведения рабочих позволяет отслеживать самочувствие человека, соблюдение техники безопасности и напоминает строителям про обед.

В поисках обеда: распознавание активности по данным фитнес-трекера - 1

Источник
Читать полностью »

8 лучших трендов International Conference on Learning Representations (ICLR) 2019

2019-11-26 в 8:04, admin, рубрики: CleverDATA, Алгоритмы, Блог компании ГК ЛАНИТ, искусственный интеллект, машинное обучение

Тема анализа данных и Data Science в наши дни развивается с поразительной скоростью. Для того, чтобы понимать актуальность своих методов и подходов, необходимо быть в курсе работ коллег, и именно на конференциях удается получить информацию о трендах современности. К сожалению, не все мероприятия можно посетить, поэтому статьи о прошедших конференциях представляют интерес для специалистов, не нашедших времени и возможности для личного присутствия. Мы рады представить вам перевод статьи Чип Хен (Chip Huyen) о конференции ICLR 2019, посвященной передовым веяниям и подходам в области Data Science.

8 лучших трендов International Conference on Learning Representations (ICLR) 2019 - 1

Читать полностью »

Natural Language Processing онлайн-чеков: курс уроков волшебства для обычного кота и другие проблемы

2019-08-13 в 8:01, admin, рубрики: CleverDATA, Блог компании ГК ЛАНИТ, будущее здесь, искусственный интеллект, машинное обучение

Компания CleverDATA занимается разработкой платформы для работы с большими данными. В частности, на нашей платформе есть возможность работать с информацией из чеков онлайн-покупок. Перед нами стояла задача научиться обрабатывать текстовые данные чеков и строить на них выводы о потребителях для создания соответствующих характеристик на бирже данных. Было естественно для решения этой задачи обратиться к машинному обучению. В этой статье мы хотим рассказать про проблемы, с которыми встретились при классификации текстов онлайн-чеков.

Natural Language Processing онлайн-чеков: курс уроков волшебства для обычного кота и другие проблемы - 1

Источник
Читать полностью »

Создаем музыку: когда простые решения превосходят по эффективности глубокое обучение

2019-06-25 в 8:02, admin, рубрики: CleverDATA, Блог компании ГК ЛАНИТ, будущее здесь, искусственный интеллект, машинное обучение

Представляю вашему вниманию перевод статьи «Создаем музыку: когда простые решения превосходят по эффективности глубокое обучение» о том, как искусственный интеллект применяется для создания музыки. Автор не использует нейронные сети для генерации музыки, а подходит к задаче, исходя из знания теории музыки, на основе мелодии и гармонии. Другой особенностью статьи является метод сравнения музыкальных произведений на основе матриц самоподобия. Такой подход, конечно, не является исчерпывающим, но он полезен как промежуточный шаг для генерации качественной музыки методами машинного обучения.

Создаем музыку: когда простые решения превосходят по эффективности глубокое обучение - 1

Читать полностью »

Анатомия рекомендательных систем. Часть вторая

2018-08-30 в 8:39, admin, рубрики: big data, CleverDATA, data mining, Алгоритмы, Блог компании ГК ЛАНИТ, Ланит, машинное обучение

Неделю назад я делал здесь обзор существующих алгоритмов рекомендаций. В этой статье я продолжу данный обзор: расскажу об item-based варианте коллаборативной фильтрации, о методах, основанных на матричных разложениях, проблемах тестирования, а также о менее «раскрученных» (но не менее интересных) алгоритмах.

Анатомия рекомендательных систем. Часть вторая - 1

Читать полностью »

Анатомия рекомендательных систем. Часть первая

2018-08-21 в 8:13, admin, рубрики: big data, CleverDATA, data mining, data scientist, Алгоритмы, алгоритмы рекомендаций, Блог компании ГК ЛАНИТ, дата саентист, Ланит, машинное обучение, рекомендательные системы

Я работаю дата-саентистом в компании CleverDATA. Мы занимаемся проектами в области машинного обучения, и один из наиболее частых запросов на разработку основанных на машинном обучении маркетинговых решений — это разработка рекомендательных моделей.

В данной статье я расскажу о рекомендательных системах, постараюсь дать максимально полный обзор существующих подходов и на пальцах объясню принципы работы алгоритмов. Часть материала базируется на неплохом курсе по рекомендательным системам лаборатории MovieLens (которая большинству знакома по одноименному датасету для тестирования рекомендаций), остальное – из личного опыта. Статья состоит из двух частей. В первой описана постановка задачи и дан обзор простых (но популярных) алгоритмов рекомендаций. Во второй статье я расскажу о более продвинутых методах и некоторых практических аспектах реализации.

Анатомия рекомендательных систем. Часть первая - 1

Источник
Читать полностью »

Классификация больших объемов данных на Apache Spark с использованием произвольных моделей машинного обучения

2018-06-01 в 10:49, admin, рубрики: akka, Apache, Apache Spark, CleverDATA, machine learning, Reactive Streams, scala, Блог компании ГК ЛАНИТ, машинное обучение

Часть 2: Решение

И снова здравствуйте! Сегодня я продолжу свой рассказ о том, как мы классифицируем большие объёмы данных на Apache Spark, используя произвольные модели машинного обучения. В первой части статьи мы рассмотрели саму постановку задачи, а также основные проблемы, которые возникают при организации взаимодействия между кластером, на котором хранятся и обрабатываются исходные данные, и внешним сервисом классификации. Во второй части мы рассмотрим один из вариантов решения данной задачи с использованием подхода Reactive Streams и его реализации с использованием библиотеки akka-streams.

Классификация больших объемов данных на Apache Spark с использованием произвольных моделей машинного обучения - 1

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «CleverDATA»

ТОП-10 трендов в сфере данных и аналитики 2021. Версия Gartner

Прикручиваем ИИ: оптимизация работы банкоматов

Уроки волшебства для кота, дейтинг для беременных и астрология

Data Scientists узнают, что интересует людей и на что они тратят деньги

В поисках обеда: распознавание активности по данным фитнес-трекера

8 лучших трендов International Conference on Learning Representations (ICLR) 2019

Natural Language Processing онлайн-чеков: курс уроков волшебства для обычного кота и другие проблемы

Создаем музыку: когда простые решения превосходят по эффективности глубокое обучение

Анатомия рекомендательных систем. Часть вторая

Анатомия рекомендательных систем. Часть первая

Классификация больших объемов данных на Apache Spark с использованием произвольных моделей машинного обучения

Часть 2: Решение