Рубрика «data mining» - 59

Выявление проблем дорожной сети с помощью Яндекс.Пробок. Лекция в Яндексе

2016-09-10 в 15:59, admin, рубрики: data mining, автомобильная навигация, Блог компании Яндекс, Геоинформационные сервисы, городская среда, исследование, исследование данных, машинное обучение, навигационные системы, пробки, пробки на дорогах

Яндекс.Пробки и связанные с ними функции в Навигаторе и Картах работают благодаря данным о скорости машин на разных участках дорог. Это совсем не новая, но по-прежнему эффективная схема. Вопрос, возникший уже по мере развития Пробок — можно ли использовать указанные данные как-нибудь ещё?

Аналитик Карт Леонид Медников рассказал о примере такого использования на конференции Яндекса «Пути Сообщения 2016». Под катом — расшифровка доклада и большинство слайдов.

Читать полностью »

Анализ данных с электросчетчика Eastron SDM220 средствами ThingSpeak

2016-09-09 в 9:40, admin, рубрики: data mining, internet of things, IoT, Matlab, modbus, rs485, SDM220, ThingSpeak, визуализация данных, Разработка для интернета вещей, умный дом, электросчетчик

Всем привет. В статье на geektimes я рассказывал, как подключиться к электросчетчику Eastron SDM220-Modbus и забрать с него данные по шине RS-485. Сегодня я хочу рассказать про сбор и анализ статистических данных о потреблении электричества в доме.

Анализ данных с электросчетчика Eastron SDM220 средствами ThingSpeak - 1
Читать полностью »

Будущее сайтов: автоматическая сборка на базе ИИ и не только

2016-09-08 в 13:47, admin, рубрики: data mining, Grid, smart-технологии, uKit, Анализ и проектирование систем, Блог компании uTeam, машинное обучение, нейронные сети, проблемы программирования, Разработка веб-сайтов, сайты для людей, тренды, умные шаблоны

Наш технический директор* верит, что искусственный интеллект будет создан ориентировочно к середине этого века, и лет через пятьдесят с большой вероятностью будет достигнута около-сингулярность с виртуализацией, ИИ и вот этим всем.

Будущее сайтов: автоматическая сборка на базе ИИ и не только - 1

Но чтобы светлое завтра наступило, уже сегодня нужно решать связанные с ним практические задачи. Так что мы занялись технологией, которая будет делать сайты за людей. Нет, не за специалистов, создающих сложные и высоконагруженные системы. А за ребят с “сайтом-визиткой за 3000” — потому что ИИ, как минимум, не пропадет на месяц после предоплаты.

Прелесть вот в чем: запуск конструктора сайтов с нейросетью и алгоритмическим дизайном** — дело не пятидесяти, а всего пары лет. Это будущее, которое можно пощупать уже сегодня.
Читать полностью »

Джентельменский набор пакетов R для автоматизации бизнес-задач

2016-09-07 в 11:55, admin, рубрики: big data, data mining, data science, R

Продолжение предыдущих публикаций «Инструменты DataScience как альтернатива классической интеграции» и
«Экосистема R как инструмент для автоматизации бизнес-задач».
Настоящая статья является ответом на возникшие вопросы по пакетам R, которые полезны для реализации описанных подходов. Я ее рассматриваю исключительно как справочную информацию, и отправную точку для последующего детального изучения заинтересовавшимися, поскольку за каждым пакетом скрывается огромное пространство со своей философией и идеологией, математикой и путями развития.

Как правило, все пакеты (9109 штук на 07.09.2016) находятся в репозитории CRAN. Те, что по тем или иным причинам, пока не опубликованы в репозиторий, могут быть найдены на GitHub. Итак, кратким списком:Читать полностью »

Экосистема R как инструмент для автоматизации бизнес-задач

2016-09-06 в 14:03, admin, рубрики: big data, data mining, data science, R

Настоящая статья является продолжением предыдущей публикации «Инструменты DataScience как альтернатива классической интеграции». Основная цель — заострить внимание как разработчиков, так и руководителей среднего звена, на широком спектре возможностей, которые предоставляют современные инструменты из сферы Data Science за рамками классических задач статистических вычислений и модной нынче темы машинного обучения. В частности, возможности экосистемы R по состоянию на август 2016 года и применение этих возможностей на примере двух задач: одной из прикладной науки, другой – из среднего бизнеса.
Читать полностью »

Инструменты Data Science как альтернатива классической интеграции

2016-09-05 в 15:04, admin, рубрики: big data, data mining, data science, R

В настоящий момент уже можно считать, что страсти по Big Data и Data Science немного утихли, а ожидание чуда, как обычно, было сильно скорректировано реальностью физического мира. Самое время заняться конструктивной деятельностью. Поиск тем на Хабре по различным ключевым словам выдал крайне скудный набор статей, поэтому я решил поделиться тем опытом, который был накоплен в части практического применения инструментов и подходов Data Science для решения повседневных задач в компании.
Читать полностью »

Обсуждение инструментов аналитики для работы с большими данными в Питере 14 сентября

2016-09-05 в 8:38, admin, рубрики: analytics, big data, data mining, wrike, wriketechclub, Анализ и проектирование систем, Блог компании Wrike

Обсуждение инструментов аналитики для работы с большими данными в Питере 14 сентября - 1

14 сентября в 19:00 мы встретимся в офисе компании Wrike, чтобы обсудить инструменты аналитики и работу с большими данными. Главное внимание мы уделим успешным практикам и инструментам, разберем конкретные кейсы, поговорим о построении системы аналитики в компании, попробуем дать конкретные советы и рекомендации. Эксперты с удовольствием ответят на ваши вопросы.
Читать полностью »

Графические модели на основе гауссовых копул

2016-09-05 в 1:09, admin, рубрики: chow-liu tree, data mining, european social survey, gaussian copula graphical models, markov random fields, R, survey data analysis, визуализация данных, открытые данные, метки: chow-liu tree, european social survey, gaussian copula graphical models, markov random fields, survey data analysis

Лог-линейные модели и их представления в виде марковских сетей позволяют показать структуру взаимосвязей между случайными величинами. Однако полученная визуализация может оказаться трудна для восприятия из-за большого числа равнозначных ребер в графе такой модели. При работе с порядковыми и бинарными переменными гауссовы копулы (Gaussian copula graphical models, сокр. GCGM) дают возможность повысить наглядность и упростить интерпретацию модели. В статье приведен краткий обзор теории и построен пример GCGM для European Social Survey данных.

Читать полностью »

Визуализация фото-портфолио. Часть 2: Word embedding

2016-09-03 в 15:07, admin, рубрики: data mining, data science, dimensionality reduction, pointwise mutual information, sklearn, SVD, t-sne, word embedding, визуализация данных, машинное обучение

Визуализация портфолио (на данном рисунке, чем краснее область, тем больше среднескачиваемых фото в этой области)

В предыдущей части речь шла о разбиении фото-портфолио по сигналам с предпоследнего слоя модели inceptionV3. В этой части я расскажу, как разбивать портфолио по ключевым словам.Читать полностью »

Визуализация фото-портфолио. Часть 1: Нестандартное применение deep learning

2016-09-03 в 13:23, admin, рубрики: data mining, data science, deep learning, dimensionality reduction, inceptionV3, keras, sklearn, t-sne, truncatedSVD, визуализация данных, машинное обучение

Визуализация портфолио (на данном рисунке, чем краснее область, тем больше фото в этой области, имеющих нулевое количество скачиваний)

Коротко о задаче: есть фото-портфолио с большим количеством фото, хотим узнать список популярных и не популярных тем.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «data mining» - 59

Выявление проблем дорожной сети с помощью Яндекс.Пробок. Лекция в Яндексе

Анализ данных с электросчетчика Eastron SDM220 средствами ThingSpeak

Будущее сайтов: автоматическая сборка на базе ИИ и не только

Джентельменский набор пакетов R для автоматизации бизнес-задач

Экосистема R как инструмент для автоматизации бизнес-задач

Инструменты Data Science как альтернатива классической интеграции

Обсуждение инструментов аналитики для работы с большими данными в Питере 14 сентября

Визуализация фото-портфолио. Часть 2: Word embedding

Визуализация фото-портфолио. Часть 1: Нестандартное применение deep learning

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «data mining» - 59

Новости

Актуальные темы

Архив