Рубрика «машинное обучение» - 250

Стивен Вольфрам: Рубежи вычислительного мышления (отчёт с фестиваля SXSW)

2015-04-12 в 23:17, admin, рубрики: a new kind of science, programming lab, siri, Stephen Wolfram, SXSW, Wolfram Alpha, wolfram cloud, wolfram data drop, wolfram mathematica, wolram language, автоматизация, Алгоритмы, Блог компании Wolfram Research, естественный язык, искуственный интеллект, клеточные автоматы, математика, машинное зрение, машинное обучение, новый вид науки, Программирование, Стивен Вольфрам, языки программирования, метки: стивен вольфрам

Перевод поста Стивена Вольфрама (Stephen Wolfram) "Frontiers of Computational Thinking: A SXSW Report".
Выражаю огромную благодарность Кириллу Гузенко за помощь в переводе.

На прошлой неделе я выступал на SXSW Interactive 2015 в Остине, штат Техас. Вот несколько отредактированная стенограмма моего выступления:

Стивен Вольфрам: Рубежи вычислительного мышления (отчёт с фестиваля SXSW) - 2

Содержание

Наиболее продуктивный год
Язык Wolfram Language
Язык для реального мира
Философия Wolfram Language
Программы размером в один твит
Вычислительное мышление для детей
Ввод запросов на естественном языке
Масштабная идея: Символьное программирование
Язык для развёртывания
Автоматизация программирования
Масштабные программы
Интернет вещей
Машинное обучение
Исследования Вычисляемой Вселенной
Вычислять, подобно тому, как это делает мозг
Язык как символьное представление
Пост-лингвистические понятия
Древняя история
Чем будет заниматься искусственный интеллект?
Бессмертие и за его пределами
Коробка триллиона душ
Обратно в 2015 год
Читать полностью »

Лекции Техносферы. 1 семестр. Алгоритмы интеллектуальной обработки больших объемов данных

2015-04-12 в 13:43, admin, рубрики: big data, data mining, mail.ru, Алгоритмы, Блог компании Mail.Ru Group, лекции техносферы, машинное обучение, Техносфера

Продолжаем публиковать материалы наших образовательных проектов. В этот раз предлагаем ознакомиться с лекциями Техносферы по курсу «Алгоритмы интеллектуальной обработки больших объемов данных». Цель курса — изучение студентами как классических, так и современных подходов к решению задач Data Mining, основанных на алгоритмах машинного обучения. Преподаватели курса: Николай Анохин (anokhinn), Владимир Гулин и Павел Нестеров (mephistopheies).

Объемы данных, ежедневно генерируемые сервисами крупной интернет-компании, поистине огромны. Цель динамично развивающейся в последние годы дисциплины Data Mining состоит в разработке подходов, позволяющих эффективно обрабатывать такие данные для извлечения полезной для бизнеса информации. Эта информация может быть использована при создании рекомендательных и поисковых систем, оптимизации рекламных сервисов или при принятии ключевых бизнес-решений.
Читать полностью »

Сравнение библиотек глубокого обучения на примере задачи классификации рукописных цифр

2015-04-07 в 17:45, admin, рубрики: caffe, data mining, deep learning, itseez, opencv, pylearn2, theano, torch, Алгоритмы, Блог компании «Itseez», Компьютерное зрение, машинное обучение, обработка изображений

Кручинин Дмитрий, Долотов Евгений, Кустикова Валентина, Дружков Павел, Корняков Кирилл

Введение

В настоящее время машинное обучение является активно развивающейся областью научных исследований. Это связано как с возможностью быстрее, ~~выше, сильнее~~, проще и дешевле собирать и обрабатывать данные, так и с развитием методов выявления из этих данных законов, по которым протекают физические, биологические, экономические и другие процессы. В некоторых задачах, когда такой закон определить достаточно сложно, используют глубокое обучение.

Глубокое обучение (deep learning) рассматривает методы моделирования высокоуровневых абстракций в данных с помощью множества последовательных нелинейных трансформаций, которые, как правило, представляются в виде искусственных нейронных сетей. На сегодняшний день нейросети успешно используются для решения таких задач, как прогнозирование, распознавание образов, сжатие данных и ряда других.
Читать полностью »

Мешок слов и сентимент-анализ на R

2015-04-07 в 9:12, admin, рубрики: data mining, kaggle, R, random forest, машинное обучение, мешок слов, сантимент-анализ, метки: R, R, random forest, мешок слов, сантимент-анализ

Эта статья подготовлена по мотивам (первой части) учебного задания Bag of Words Kaggle, но это не перевод. Оригинальное задание сделано на Python. Я же хотел оценить возможности языка R для обработки текстов на естественном языке и заодно попробовать реализацию Random Forest в обертке R-пакета caret.

Смысл задания – построить «машину», которая будет определенным образом обрабатывать обзоры фильмов на английском языке и определять тональность обзора, относя его к одному из двух классов: негативные/позитивные. В качестве обучающей выборки в задании используется набор данных с двадцатью пятью тысячами ревю из IMDB, размеченных неизвестными добровольцами.
Читать полностью »

Победы в конкурсах программирования негативно коррелируют с успехами в работе

2015-04-06 в 7:28, admin, рубрики: Google, ИИ, карьера, Лайфхаки для гиков, машинное обучение, наём сотрудников, Питер Норвиг, Программирование, Спортивное программирование, Статистика в IT, метки: HR, наём сотрудников, Питер Норвиг

Если вы хотите построить успешную карьеру в сфере разработки ПО, ни в коем случае не увлекайтесь спортивным программированием и участием в конкурсах.

Такой вывод следует из беспристрастной статистики и дата-майнинга рабочих показателей сотрудников Google, рассказал Питер Норвиг в лекции, прочитанной 26 марта 2015 года в Венском техническом университете.

Читать полностью »

Антифрод (часть 4): аналитическая система распознания мошеннических платежей

2015-04-03 в 6:26, admin, рубрики: antifraud, azure ml, data mining, machine learning, Microsoft Azure, машинное обучение, платежные системы, метки: antifraud

No Fraud

В заключительной четвертой части статьи подробно обсудим наиболее сложную с технической точки зрения часть antifraud-сервиса – аналитическую систему распознания мошеннических платежей по банковским картам.

Выявление различного рода мошенничеств является типичным кейсом для задач обучения с учителем (supervised learning), поэтому аналитическая часть антифрод-сервиса, в соответствии с лучшими отраслевыми практиками, будет построена с использованием алгоритмов машинного обучения.

Для стоящей перед нами задачи воспользуемся Azure Machine Learning – облачным сервисом выполнения задач прогнозной аналитики (predictive analytics). Для понимания статьи будут необходимы базовые знания в области машинного обучения и знакомство с сервисом Azure Machine Learning.

Что уже было сделано? (для тех, кто не читал предыдущие 3 части, но интересуется)

В первой части статьи мы обсудили, почему вопрос мошеннических платежей (fraud) стоит так остро для всех участников рынка электронных платежей – от интернет-магазинов до банков – и в чем основные сложности, из-за которых стоимость разработки таких систем подчас является слишком высокой для многих участников ecommerce-рынка.

Во 2-ой части были описаны требования технического и нетехнического характера, которые предъявляются к таким системам, и то, как я собираюсь снизить стоимость разработки и владения antifraud-системы на порядок(и).

В 3-ей части была рассмотрена программная архитектура сервиса, его модульная структура и ключевые детали реализации.

В заключительной четвертой части у нас следующая цель…

Цель

В этой части я опишу проект, на первом шаге которого мы обучим четыре модели, используя логистическую регрессию, персептрон, метод опорных векторов и дерево решений. Из обученных моделей выберем ту, которая дает большую точность на тестовой выборке и опубликуем ее в виде REST/JSON-сервиса. Далее для полученного сервиса напишем программного клиента и проведем нагрузочное тестирование на REST-сервис.

Читать полностью »

Машинное обучение в навигационных устройствах: определяем маневры машины по акселерометру и гироскопу

2015-04-02 в 21:07, admin, рубрики: mobile development, open source, Алгоритмы, Геоинформационные сервисы, машинное обучение, навигатор, навигационные системы, нейронные сети

Программы, которые доступны нам сегодня для автомобильной навигации оказывают большую помощь водителям. Они помогают нам ориентироваться в незнакомой местности и объезжать пробки. Это большой труд людей со всего мира, который сделал нашу жизнь проще. Но нельзя останавливаться на достигнутом, технологии идут вперед и качество программ также должно расти.

Сегодня, на мой взгляд, одна из проблем навигационных устройств – это то, что они не ведут пользователя по полосам. Эта проблема увеличивает время в пути, пробки и аварийность. Недавно google maps начали отображать разметку дороги перед поворотом, что уже хороший результат, но и тут можно многое улучшить. Карты не знают на какой полосе сейчас находится машина, средствами gps узнать это проблематично, у gps слишком большая погрешность для этого. Если бы мы знали текущую полосу, то знали бы скорость движения по полосами и могли бы задолго подсказывать пользователю в явном виде, на какую полосу и когда ему лучше перестроиться. Например, навигатор говорил бы “Продолжайте держаться этой полосы до перекрестка” или “Перестройтесь на крайнюю левую полосу”.

В этой статье мы попробуем рассказать, как мы пытаемся определять перестроения, текущую полосу движения автомобиля, повороты, обгоны, а также другие маневры с помощью машинного обучения по данным акселерометра и гироскопа.

Читать полностью »

Azure Machine Learning для Data Scientist

2015-04-02 в 9:15, admin, рубрики: azure ml, cloud, machine learning, Microsoft Azure, Алгоритмы, Блог компании Microsoft, машинное обучение, облако

Эта статья создана нашим другом из коммьюнити, Дмитрием Петуховым, Microsoft Certified Professional, разработчиком компании Quantum Art.
Статья — часть цикла про Fraud Detection, остальные статьи можно найти в профиле у Дмитрия.

Azure Machine Learning для Data Scientist - 1

Azure Machine Learning – облачный сервис для выполнения задач прогнозной аналитики (predictive analytics). Сервис представлен двумя компонентами: Azure ML Studio – средой разработки, доступной через web-интерфейс, и web-сервисами Azure ML.
Типичная последовательность действий data scientist'a при поиске закономерностей в наборе данных с использованием алгоритмов обучения с учителем изображена и подробно описана под хабракатом.
Читать полностью »

Немного о лаборатории Data Science в Билайне

2015-03-31 в 7:49, admin, рубрики: big data, data mining, data science, анализ данных, Анализ и проектирование систем, билайн, Блог компании ВымпелКом (Билайн), Большие данные, математика, машинное обучение, рекомендательные системы, метки: Big Data, Data Mining, Data Science, большие данные

Немного о лаборатории Data Science в Билайне - 1

Привет! Меня зовут Александр Крот, я отвечаю за разработку алгоритмов машинного обучения и интеллектуального анализа данных в компании Билайн, а также за подготовку и отбор специалистов по работе с данными под руководством Сергея Марина, который ранее знакомил Вас с работой нашего подразделения Big Data. Я уже писал про отдельные аспекты Big Data и Machine Learning, но сегодня я расскажу, как это устроено на практике, а именно — как мы в Билайн решаем задачи, связанные с анализом больших данных, как отбираем специалистов, какие инструменты и методы применяем на практике.
Читать полностью »

Big Data в Билайне: реальный опыт

Big Data в Билайне: реальный опыт - 1

Информация

Обсуждаемое

Рекомендуем

Рубрика «машинное обучение» - 250

Стивен Вольфрам: Рубежи вычислительного мышления (отчёт с фестиваля SXSW)

Содержание

Лекции Техносферы. 1 семестр. Алгоритмы интеллектуальной обработки больших объемов данных

Сравнение библиотек глубокого обучения на примере задачи классификации рукописных цифр

Введение

Мешок слов и сентимент-анализ на R

Победы в конкурсах программирования негативно коррелируют с успехами в работе

Антифрод (часть 4): аналитическая система распознания мошеннических платежей

Цель

Машинное обучение в навигационных устройствах: определяем маневры машины по акселерометру и гироскопу

Azure Machine Learning для Data Scientist

Немного о лаборатории Data Science в Билайне

Big Data в Билайне: реальный опыт

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «машинное обучение» - 250

Содержание

Введение

Цель

Новости

Актуальные темы

Архив