В начале декабря в Монреале прошла 32-ая ежегодная конференция Neural Information Processing Systems, посвященная машинному обучению. По неофициальному табелю о рангах эта конференция является топ-1 событием подобного формата в мире. Все билеты на конференцию в этом году были раскуплены за рекордные 13 минут. У нас большая команда data scientist’ов МТС, но лишь одному из них – Марине Ярославцевой (magoli) – посчастливилось попасть в Монреаль. Вместе с Данилой Савенковым (danila_savenkov), который остался без визы и следил за конференцией из Москвы, мы расскажем о работах, показавшихся нам наиболее интересными. Эта выборка очень субъективна, но, надеемся, она заинтересует вас.
Рубрика «машинное обучение» - 119
Обзор NeurIPS-2018
2018-12-28 в 12:34, admin, рубрики: BigData, data mining, neurips, nips, Блог компании МТС, искусственный интеллект, конференция, математика, машинное обучение, монреаль, МТСЧто делать с людьми, которых заменят роботы?
2018-12-27 в 10:42, admin, рубрики: big data, data mining, kaggle, sna, Алгоритмы, алгоритмы обработки данных, анализ данных, анализ социальных сетей, Блог компании Школа Данных, искусственный интеллект, математика, машинное обучение, нейронные сети, нейросети, рекомендательные системы, Чат-боты, школа данных
В этой предновогодней публикации мы решили немного порассуждать о будущем в мире роботов и о роли человека в нем.
Предсказывать будущее в наши дни стало абсолютным must have среди экспертов. Когда технологии меняют мир настолько стремительно, очень хочется заглянуть хотя бы на несколько лет вперед. Цели разные. Потребителям — пофантазировать, восхититься и/или ужаснуться, бизнесам — скорректировать планы, политикам — продумать меры по сохранению спокойствия в социуме на случай «большого технологического шухера».Читать полностью »
Как мы не выиграли хакатон
2018-12-26 в 11:02, admin, рубрики: computer vision, GAN, Hackathon, Блог компании Open Data Science, искусственный интеллект, машинное обучение, обработка изображений, ХакатоныС 30 ноября по 2 декабря в Москве прошел PicsArt AI hackathon c призовым фондом — 100,000$. Основной задачей было сделать AI решение для обработки фото или видео, которое можно будет использовать в приложение PicsArt. Коллега по работе(на тот момент) Артур Кузин предложил поучаствовать, заинтересовав меня идеей — анонимизация личных фотографий пользователей с сохранением деталей(мимики и т.д). Также Артур позвал Илью Кибардина — студента МФТИ (кому-то же нужно было писать код). Название родилось очень быстро: DeepAnon.
Это будет рассказ про наше решение, его деградацию развитие, хакатон, и как не надо подстраиваться под жюри.
Машинное обучение для поиска ошибок в коде: как я стажировался в JetBrains Research
2018-12-25 в 19:16, admin, рубрики: hse, jetbrains, jetbrains research, автоматический поиск багов, Блог компании Питерская Вышка, Карьера в IT-индустрии, машинное обучение, питерская вышка, Учебный процесс в ITНедавно мы рассказывали о том, как попасть на стажировку в Google. Помимо Google наши студенты пробуют свои силы в JetBrains, Яндекс, Acronis и других компаниях.
В этой статье я поделюсь своим опытом прохождения стажировки в JetBrains Research, расскажу о задачах, которые там решают, и подробнее остановлюсь на том, как при помощи машинного обучения можно искать баги в программном коде.
Mixture Density Networks
2018-12-25 в 15:36, admin, рубрики: machine learning, mdn, python, pytorch, Алгоритмы, математика, машинное обучение, ПрограммированиеВсем привет!
Давайте поговорим о, как вы уже наверное смогли догадаться, нейронных сетях и машинном обучении. Из названия понятно, что будет рассказано о Mixture Density Networks, далее просто MDN, переводить название не хочу и оставлю как есть. Да, да, да… будет немного скучной математики и теории вероятности, но без неё, к сожалению, или к счастью, тут уж сами решайте, трудно представить мир машинного обучения. Но спешу вас успокоить, ее будет относительно мало и она будет не сильно сложная. Да и вообще ее можно будет пропустить, а просто посмотреть на небольшое количество кода на Python и PyTorch, все верно, сеть мы будем писать с помощью PyTorch, а так же на различные графики с результатами. Но самое главное то, что будет возможность немного разобраться и понять что же такое MD сети.
Что ж начнем!
Читать полностью »
Новогодний датасет 2018: открытая семантика русского языка
2018-12-25 в 8:40, admin, рубрики: natural language processing, естественный язык, лингвистика, машинное обучение, открытые данные, Семантика, семантическая разметка, сентимент-анализ, ЭмоцииОткрытая семантика русского языка, об истории создания которой вы можете прочитать здесь и здесь, получила большое обновление. Мы собрали достаточное количество данных, чтобы применить поверх собранной разметки машинное обучение и построить семантическую модель языка. Что из этого получилось смотрите под катом.
Нейросеть с амёбой решили задачу коммивояжера для 8 городов
2018-12-24 в 19:10, admin, рубрики: Алгоритмы, амёба, биокомпьютер, Биотехнологии, задача коммивояжёра, математика, машинное обучение, Научно-популярное
Решения задачи коммивояжера, полученные вычислительной системой на основе амёбы. Примеры туров коммивояжёра по четырём, пяти, шести, семи и восьми городам, полученные в экспериментах, где каждый тур окрашен в красный цвет на соответствующих каналах с правого рисунка. Левые панели показывают переданные светлые изображения начальных состояний (
Группа японских исследователей из Университета Кейо в Токио продемонстрировала, что амёбы способна генерировать приближённые решения удивительно сложной математической задачи, известной как задача коммивояжера.
Читать полностью »
Security Week 52: The Greatest Hits
2018-12-24 в 12:42, admin, рубрики: IoT, meltdown, spectre, Блог компании «Лаборатория Касперского», информационная безопасность, машинное обучениеЗапомните этот пост, через 10 лет все будут говорить: вот, все правильно в дайджесте написали. Или наоборот: вообще не угадали, ни в одном месте. Предсказывать будущее — занятие, обреченное на провал, так как предсказание всегда основано на знаниях о настоящем и прошлом. Наступающий 2019 год описан в «Бегущем по лезвию бритвы» Филипа Дика, который-таки умел предвидеть. Согласно роману (и немного — фильму), мы все живем в неблагополучном мире, где постоянно идет дождь, есть летающие автомобили и роботы, но совсем нет животных.
Именно поэтому предсказания экспертов «Лаборатории Касперского» очень практичные, они скорее рассчитаны на безопасников, которым нужно определить тренды на следующий год. Но все же давайте попробуем выбрать события 2018 года, которые могут стать основой чего-то большего в информационной безопасности, актуального в течение долгого времени. При подготовке использовались материалы из этого блога за весь год, так что перед вами уникальный формат: дайджест дайджестов.
Читать полностью »
Computer Vision Annotation Tool: универсальный подход к разметке данных
2018-12-24 в 6:44, admin, рубрики: annotation tool, computer vision, data annotation, deep learning, labeling tool, open source, Блог компании Intel, искусственный интеллект, машинное обучениеНижегородский офис компании Intel, помимо прочего, занимается разработкой алгоритмов компьютерного зрения на основе глубоких нейронных сетей. Для обучения моделей требуется множество размеченных данных. Теоретически, существует много способов подготовить их, однако наличие специализированного программного обеспечения многократно ускоряет этот процесс. Так, в целях повышения эффективности и качества разметки, мы разработали собственный инструмент – Computer Vision Annotation Tool (CVAT).
Искусственный интеллект мыслит, как группа людей, что вызывает беспокойство
2018-12-22 в 12:48, admin, рубрики: Биотехнологии, искусственный интеллект, машинное обучение, Научно-популярное, Читальный залИскусственный интеллект был создан для принятия организационных решений и государственного управления; он нуждается в человеческой этике, заявляет Джонни Пенн из Кембриджского университета
Искусственный интеллект (ИИ) повсюду, но он придуман полностью не историческим способом. Чтобы понять влияние ИИ на нашу жизнь, важно оценить обстановку, в котором он был создан. В конце концов, статистика и государственный контроль развивались рука об руку в течение сотен лет.
Рассмотрим информатику. Его происхождение прослеживается не только аналитической философией, чистой математикой и Аланом Тьюрингом, но и что удивительно, историей государственного управления. В книге «Правительственная машина: революционная история компьютера», изданной в 2003 году, Джон Агар из Университетского колледжа Лондона рисует диаграммы развития британской гражданской службы, как она увеличилась с 16 000 сотрудников в 1797 году до 460 000 к 1999 году. Он заметил, аномальное сходство между функциональностью человеческой бюрократии и электронно-вычислительной машиной. (Он признался, что не может утверждать, было ли это наблюдение тривиальным или глубоким).
Обе системы обрабатывали большое количество информации, используя иерархию предварительно установленных, но адаптируемых правил. Но один из них происходил от другого. Это показало важную связь между организацией социальных структур людей и цифровыми инструментами, предназначенными для их обслуживания. Г-н Агар связывает само происхождение информатики с Аналитической маши́ной Чарльза Бэббиджа, разработанной в 1820-х годах в Британии. Ее разработка была субсидирована правительством, предполагая, что она будет служить его спонсору. Проекты Бэббиджа, отмечает г-н Агар, следует рассматривать как «материализацию государственной деятельности».Читать полностью »