В ноябре я публиковал статью «Яндекс.Метеум – технология без технологии. Маркетинг с точностью до района», где соотносил качество прогнозов Яндекса с другими сервиса. Акцент делался на температуре, без разбора других параметров. Вывод был таков – температурный прогноз Яндекса не показывает каких-то исключительных результатов по сравнению с уже зарекомендовавшими себя прогностическими сервисами. Рекомендую ознакомиться с полным текстом. На этот раз пришло время проверить другой ключевой параметр – осадки.
Рубрика «машинное обучение» - 108
Насколько точно Яндекс прогнозирует осадки зимой? Анализируем точность прогностических сервисов
2019-04-09 в 16:38, admin, рубрики: Геоинформационные сервисы, Гидрометцентр, машинное обучение, метеорология, Научно-популярное, прогноз погоды, яндексТри проблемы сервисов для проверки английской грамматики, и можно ли их решить
2019-04-09 в 11:27, admin, рубрики: grammar checking, natural language processing, грамматика, информационная безопасность, машинное обучение, онлайн-помощники, сервисыГрамматика английского языка далеко не всегда проста, и даже самые образованные люди из числа его носителей делают ошибки. Поэтому использование специализированного софта для исправления неточностей в письменном английском кажется хорошей идеей. Ее подкрепляет довольно агрессивная реклама ведущих компаний этого рынка.
На практике все не так просто, и сегодня мы поговорим о трех главных проблемах, с которыми могут столкнуться пользователи таких сервисов. Также обсудим их возможные решения.Читать полностью »
Robotic Process Automation — новый взгляд на старые технологии
2019-04-09 в 10:44, admin, рубрики: AI, ml, qa, RPA, Блог компании Инфосистемы Джет, машинное обучение, Тестирование IT-систем
Если сегодня приходишь в МФЦ по любому вопросу, уйма времени уходит на ожидание: пока сотрудник введёт информацию из разных документов в требуемые формы, поставит какие-то галочки, отправит какие-то запросы… А представьте себе прекрасное будущее: так же приходишь в МФЦ, даёшь паспорт, его сканируют, и дальше происходит магия — программный робот всё парсит, мгновенно рассылает запросы в разные базы данных, агрегирует ответы и через несколько минут выдаёт результат/ответ/справку/новый документ, попутно зарегистрировав его в анналах.
Скажете, несбыточные фантазии? Да почему же несбыточные — подходящие технологии уже готовы и практически обкатаны. Это RPA (Robotic Process Automation). Термин появился в 2012 году благодаря компании Blue Prism. Она 17 лет назад стала пионером в области автоматизации сервисов управления офисными операциями. Правда, в то время к этой идее не относились серьёзно и крупный бизнес считал ее скорее утопической, чем реальной.
Но всё изменилось с появлением систем искусственного интеллекта. Именно они в корне изменили отношение к RPA.
Читать полностью »
Для чего и как мы скрываем госномера автомобилей в объявлениях Авито
2019-04-09 в 10:17, admin, рубрики: computer vision, development, machine learning, object detection, production, python, Алгоритмы, машинное обучение, ПрограммированиеПривет. В конце прошлого года мы стали автоматически скрывать номера автомобилей на фотографиях в карточках объявлений на Авито. О том, зачем мы это сделали, и какие есть способы решения таких задач, читайте в статье.
SNA Hackathon 2019
2019-04-09 в 9:10, admin, рубрики: catboost, mlbootcamp, ok.ru, sna, машинное обучение, ХакатоныВ феврале-марте 2019 года проходил конкурс по ранжированию ленты социальной сети SNA Hackathon 2019, в котором наша команда заняла первое место. В статье я расскажу про организацию конкурса, методах, которые мы попробовали, и настройках catboost для обучения на больших данных.
Предсказания от математиков. Разбираем основные методы обнаружения аномалий
2019-04-09 в 8:04, admin, рубрики: Блог компании ГК ЛАНИТ, искусственный интеллект, Ланит, машинное обучение, Промышленное программированиеЗа рубежом все большую популярность набирает использование искусственного интеллекта в промышленности для предиктивного обслуживания (predictive maintenance) различных систем. Цель этой методики — определение неполадок в работе системы на этапе эксплуатации до выхода её из строя для своевременного реагирования.
Насколько востребован такой подход у нас и на Западе? Вывод можно сделать, например, по статьям на Хабре и в Medium. На Хабре почти не встречается статей по решению задач предиктивного обслуживания. На Medium же есть целый набор. Вот здесь, ещё здесь и здесь хорошо описано, в чем цели и преимущества такого подхода.
Из этой статьи вы узнаете:
- зачем нужна эта методика,
- какие подходы машинного обучения чаще используются для предиктивного обслуживания,
- как я опробовал один из приёмов на простом примере.
Машинное обучение для менеджеров: таинство сепуления
2019-04-07 в 14:39, admin, рубрики: машинное обучение, фасилитацияВведение
Очередной раз работая с компанией, делающей проект, связанный с машинным обучением (ML), я обратил внимание, что менеджеры используют термины из области ML, не понимая их сути. Хотя слова произносятся грамматически правильно и в нужных местах предложений, однако их смысл им не более ясен, чем назначение сепулек, которые, как известно, применяются в сепулькариях для сепуления. В тоже время тимлидам и простым разрабам кажется, что они говорят с менеджментом на одном языке, что и приводит к конфликтным ситуациям, так осложняющим работу над проектом. Итак, данная статья посвящена приемам фасилитации (с латинского: упрощение или облегчение) общения разработчиков с менеджментом или тому, как просто и доходчиво объяснить базовые термины ML, приведя тем самым ваш проект к успеху. Если вам близка эта тема — добро пожаловать под кат.
Таблица Менделеева на школьной информатике
2019-04-06 в 8:45, admin, рубрики: Delphi, Pascal, Алгоритмы, базы данных, Википедия, графическое программирование, Занимательные задачки, Икусственный интеллект, интернет, информатика в школе, комплексный метод обучения, машинное обучение, Настольные компьютеры, образование, периодическая таблица элементов, поисковые технологии, Программирование, Софт, стиль программирования, СУБД, Управляющие карты, Учебный процесс в IT, физика, химия, хранение данных, читабельность кода(Управляющие карты)
(Посвящается Международному году Периодической таблицы химических элементов)
Помнится, мы проходили утку. Это были сразу три урока: география, естествознание и русский. На уроке естествознания утка изучалась как утка какие у нее крылышки, какие лапки, как она плавает и так далее. На уроке географии та же утка изучалась как житель земного шара: нужно было на карте показать, где она живет и где ее нет. На русском Серафима Петровна учила нас писать «у-т-к-а» и читала что-нибудь об утках из Брема. Мимоходом она сообщала нам, что по-немецки утка так-то, а по-французски так-то. Кажется, это называлось тогда «комплексным методом». В общем, все выходило «мимоходом».
Вениамин Каверин, Два капитана
В приведенной цитате Вениамин Каверин мастерски показал недостатки комплексного метода обучения, однако в некоторых (может быть, довольно редких) случаях элементы этого метода бывают оправданы. Один из таких случаев — это Периодическая таблица Д.И.Менделеева на уроках школьной информатики. Задача программной автоматизации типовых действий с таблицей Менделеева наглядна для школьников, начавших изучать химию, и разбивается на многие типовые химические задачи. В то же время в рамках информатики эта задача позволяет в простой форме продемонстрировать способ управляющих карт, который можно отнести к графическому программированию, понимаемому в широком смысле слова как программирование с помощью графических элементов.
Читать полностью »
ИИ, школьник и большие призовые: как в 8 классе заняться machine learning
2019-04-04 в 5:00, admin, рубрики: Блог компании Сбербанк, искусственный интеллект, машинное обучение, Хакатоны, школьникиПривет!
Хотим рассказать о таком необычном виде заработка для подростков, как участие в хакатонах. Это и финансово выгодно, и позволяет на практике применить знания, полученные в школе и благодаря чтению умных книжек.
Простой пример – прошлогодний хакатон Академии искусственного интеллекта для школьников. Его участникам нужно было предсказать исход игры Dota 2. Победителем соревнования тогда стал Александр Мамаев — десятиклассник из Челябинска. Его алгоритм точнее всего определил команду победителя схватки. Благодаря этому Александр получил солидные призовые — 100 тыс. рублей.
Кодирование речи на 1600 бит-с нейронным вокодером LPCNet
2019-04-03 в 15:53, admin, рубрики: Codec2, LPC. кодирование звука, LPCNet, RNN, wavenet, WaveRNN, Алгоритмы, звук, кепстр, машинное обучение
Это продолжение первой статьи о LPCNet. В первом демо мы представили архитектуру, которая сочетает обработку сигналов и глубокое обучение для повышения эффективности нейронного синтеза речи. На этот раз превратим LPCNet в нейронный речевой кодек с очень низким битрейтом (см. научную статью). Его можно использовать на текущем оборудовании и даже на телефонах.
Впервые нейронный вокодер работает в реальном времени на одном процессорном ядре телефона, а не на высокоскоростном GPU. Итоговый битрейт 1600 бит/с примерно в десять раз меньше, чем выдают обычные широкополосные кодеки. Качество намного лучше, чем у существующих вокодеров с очень низким битрейтом и сопоставимо с более традиционными кодеками, использующими более высокий битрейт.
Читать полностью »