В эту короткую неделю новостей и статей не очень много, но все же есть один день разработчика в банке, исследование приложения Instagram в поисках звонков, анимации, разведение собственных криптокотов, ретаргетинг и дефицит UX.
Рубрика «машинное обучение» - 167
Дайджест интересных материалов для мобильного разработчика #244 (5 марта— 11 марта)
2018-03-11 в 12:35, admin, рубрики: Instagram, kotlin, swift, UX, ux дизайн, анимации, Блог компании Everyday Tools, искусственный интеллект, маркетинг мобильных приложений, машинное обучение, разработка игр, разработка мобильных приложений, Разработка под android, разработка под iOS, юнит-тестыЩи, или Распознавание 330 млн лиц на скорости 400 фото – сек
2018-03-06 в 21:09, admin, рубрики: big data, cnn, data mining, face detection, face recognition, highload, Блог компании Одноклассники, машинное обучение, обработка изображенийРаспознаванием лиц в 2018 году никого не удивишь – каждый студент, может, даже школьник, его делал. Но всё становится немного сложнее, когда у вас не датасет на 1 млн пользователей, а:
- 330 миллионов пользовательских аккаунтов;
- ежедневно заливается 20 млн пользовательских фотографий;
- максимальное время на обработку одного фото не должно превышать 0.2 сек;
- ограниченные объемы оборудования для решения задачи.
В этой статье мы поделимся опытом разработки и запуска системы распознавания лиц на пользовательских фотографиях в социальной сети Одноклассники и расскажем про все ”от А до Я”:
- математический аппарат;
- техническую реализацию;
- результаты запуска;
- и акцию StarFace, которую мы использовали для PR-а нашего решения.
Топ-10 трендов технологий искусственного интеллекта (ИИ) в 2018 году
2018-03-06 в 15:28, admin, рубрики: big data, Блог компании Отус, ИИ и машинное обучение, искусственный интеллект, Исследования и прогнозы в IT, машинное обучение, нейронные сетиДобра!
Слушатели первого курса «Разработчик BigData» вышли на финишную прямую — сегодня начался последний месяц, где выжившие займутся боевым выпускным проектом. Соответственно, открыли и набор на этот достаточно непростой курс. Поэтому давайте рассмотрим одну интересную статью-заметку по современным трендам в ИИ, которые тесно связаны с BD, ML и прочим.
Поехали.
Искусственный интеллект находится под пристальным вниманием глав правительств и бизнес-лидеров в качестве основного средства оценки верности решений. Но что происходит в лабораториях, где открытия академических и корпоративных исследователей будут устанавливать курс развития ИИ на следующие годы? Наша собственная команда исследователей из AI Accelerator от PwC нацелилась на ведущие разработки, за которыми следует внимательно следить как бизнес-лидерам, так и технологам. Вот что они из себя представляют и почему они так важны.
Коэффициент Джини. Из экономики в машинное обучение
2018-03-06 в 10:59, admin, рубрики: auc, data mining, gini, kaggle, python, бинарная классификация, Блог компании Open Data Science, джини, математика, машинное обучение, метрика, скоринг, статистика, теория вероятностейИнтересный факт: в 1912 году итальянский статистик и демограф Коррадо Джини написал знаменитый труд «Вариативность и изменчивость признака», и в этом же году «Титаник» затонул в водах Атлантики. Казалось бы, что общего между этими двумя событиями? Всё просто, их последствия нашли широкое применение в области машинного обучения. И если датасет «Титаник» в представлении не нуждается, то об одной замечательной статистике, впервые опубликованной в труде итальянского учёного, мы поговорим поподробней. Сразу хочу заметить, что статья не имеет никакого отношения к коэффициенту Джини (Gini Impurity), который используется в деревьях решений как критерий качества разбиения в задачах классификации. Эти коэффициенты никак не связаны друг с другом и общего между ними примерно столько же, сколько общего между трактором в Брянской области и газонокосилкой в Оклахоме.
Коэффициент Джини (Gini coefficient) — метрика качества, которая часто используется при оценке предсказательных моделей в задачах бинарной классификации в условиях сильной несбалансированности классов целевой переменной. Именно она широко применяется в задачах банковского кредитования, страхования и целевом маркетинге. Для полного понимания этой метрики нам для начала необходимо окунуться в экономику и разобраться, для чего она используется там.
Читать полностью »
Итоги MentorHack: чат-бот по выделению тасков из диалогов, сервисы для построения карьерных траекторий и команд
2018-03-06 в 10:30, admin, рубрики: api, анализ данных, Блог компании Школа GoTo, вакансии, машинное обучение, менторство, резюме, управление персоналом, хакатон, ХакатоныНедавно мы поучаствовали в организации MentorHack – хакатона по созданию сервисов для наставничества в корпоративной среде, предпринимательстве и образовании.
Под катом немного о хакатоне: сквозь будни, проверки ФСО и форум к победителях с чат-ботом для автовыделением тасков из переписок, сервисом для построения карьерных траекторий до желаемых позиций в перспективе и сборки команд под проекты.
Обзор нового алгоритма уменьшения размерности UMAP. Действительно ли он лучше и быстрее, чем t-SNE?
2018-03-06 в 9:59, admin, рубрики: big data, data mining, t-sne, umap, Блог компании New Professions Lab, визуализация данных, машинное обучение, обучение без учителя, уменьшение размерности данныхПривет! Задача снижения размерности является одной из важнейших в анализе данных и может возникнуть в двух следующих случаях. Во-первых, в целях визуализации: перед тем, как работать с многомерными данными, исследователю может быть полезно посмотреть на их структуру, уменьшив размерность и спроецировав их на двумерную или трехмерную плоскость. Во-вторых, понижение размерности полезно для предобработки признаков в моделях машинного обучения, поскольку зачастую неудобно обучать алгоритмы на сотне признаков, среди которых может быть множество зашумленных и/или линейно зависимых, от них нам, конечно, хотелось бы избавиться. Наконец, уменьшение размерности пространства значительно ускоряет обучение моделей, а все мы знаем, что время — это наш самый ценный ресурс.
UMAP (Uniform Manifold Approximation and Projection) — это новый алгоритм уменьшения размерности, библиотека с реализацией которого вышла совсем недавно. Авторы алгоритма считают, что UMAP способен бросить вызов современным моделям снижения размерности, в частности, t-SNE, который на сегодняшний день является наиболее популярным. По результатам их исследований, у UMAP нет ограничений на размерность исходного пространства признаков, которое необходимо уменьшить, он намного быстрее и более вычислительно эффективен, чем t-SNE, а также лучше справляется с задачей переноса глобальной структуры данных в новое, уменьшенное пространство.
В данной статье мы постараемся разобрать, что из себя представляет UMAP, как настраивать алгоритм, и, наконец, проверим, действительно ли он имеет преимущества перед t-SNE.
Удаление фона с помощью глубокого обучения
2018-03-06 в 8:09, admin, рубрики: Блог компании NIX Solutions, глубокое обучение, машинное обучение, обработка изображений, удаление фона
Перевод Background removal with deep learning.
На протяжении последних нескольких лет работы в сфере машинного обучения нам хотелось создавать настоящие продукты, основанные на машинном обучении.
Несколько месяцев назад, после прохождения отличного курса Fast.AI, звезды совпали, и у нас появилась такая возможность. Современные достижения в технологиях глубокого обучения позволили осуществить многое из того, что раньше казалось невозможным, появились новые инструменты, которые сделали процесс внедрения более доступным, чем когда-либо.
Мы поставили перед собой следующие цели:
- Улучшить наши навыки работы с глубоким обучением.
- Совершенствовать наши навыки внедрения продуктов, основанных на ИИ.
- Создать полезный продукт с перспективами на рынке.
- Весело провести время (и помочь весело провести время нашим пользователям).
- Обменяться опытом.
Backend на CodeFest: бигдэйта, машинлёнинг и блокчейн
2018-03-06 в 6:49, admin, рубрики: .net, AI, backend, big data, blockchain, CodeFest, kubernetes, mashine learning, nginx, postgresql 10, Raspberry Pi, Блог компании CodeFest, блокчейн, машинное обучение, Программирование, Разработка веб-сайтов, разработка мобильных приложений, сборка мусораМенеджмент, тестирование и фронтенд позади, переходим к бекенду — секции-рекордсмену по количеству баззвордов.
Машинное обучение в канализации (в хорошем смысле)
2018-03-06 в 6:22, admin, рубрики: api, azure, machine learning, microsoft, Microsoft Azure, ml, PowerBI, Блог компании Microsoft, канализация, машинное обучениеСточные воды… Казалось бы, что тут может быть связанного с технологиями. Ну, возможно, какой-нибудь датчик загрязненности. Но, оказывается, нет. Все намного интереснее. Ведь машинное обучение помогает выявлять аномалии и отклонения в системе контроля сточных вод. Подробности под катом!
О нейрокомпьютерах позднего СССР
2018-03-05 в 10:36, admin, рубрики: машинное обучение, параллельное программирование, ПрограммированиеЗаголовок получился, конечно, желтушный. Сразу за него извиняюсь.
Сегодня всего лишь хочу поделиться одним занимательным буклетом, который был выпущен институтом computer sciences академии наук СССР в (предположительно) 1989 году.