Рубрика «data mining» - 103

Прогнозирование закупок: адская, но очень полезная математика

2012-06-07 в 6:32, admin, рубрики: data mining, анализ данных, Блог компании КРОК, ликбез, недозаказ, перезаказ, пиво, прогнозирование спроса, ритейл, метки: анализ данных, ликбез, недозаказ, перезаказ, пиво, прогнозирование спроса, ритейл

Представьте двух героев: коммерсанта Александра и сисадмина Василия. Вася, как олицетворение среднестатистического клиента, каждый вечер заходит в магазин Саши (представителя розничной сети) и покупает пиво. Саша заказывает для него 7 бутылок пива в неделю. Иногда Вася остаётся работать с ночевкой и не выходит из серверной, а иногда – после работы берёт по две бутылки пива для себя и главбуха.

Прогнозирование закупок: адская, но очень полезная математика
^{График спроса на пиво в зависимости от жизненных приключений Васи}

Саша не может предсказать эти периоды, поэтому постоянно находится меж двух огней: либо купить больше товара, «заморозить» деньги и потратиться на его хранение, либо купить ровно по среднему спросу, рискуя в какой-то момент расстроить Васю и его друга бухгалтера отсутствием нужного количества пива.Читать полностью »

Анализ структуры мирового рынка методами теории графов

2012-06-01 в 12:05, admin, рубрики: data mining, datamining, Алгоритмы, анализ данных, Блог компании Luxoft, экономика, метки: datamining, анализ данных, экономика

Исследователями Цюрихского технологического института был произведён анализ мирового финансового рынка методами теории графов. Ученые пытались найти наиболее влиятельные, частные финансовые структуры. В рамках работы было проанализировано порядка 85 миллионов компаний, построены зависимости между ними и выделены наиболее значимые корпорации.

Читать полностью »

Астрология и Data mining

2012-05-31 в 3:22, admin, рубрики: data mining, астрология, Вконтакте, социальные сети, метки: data mining, астрология, социальные сети

Астрология и Data mining
Как и многие люди технического склада ума, я с крайним недоверием отношусь к астрологии, гороскопам и прочим псевдонаукам. Моё мировозрение пошатнулось когда я от скуки решил изучить влияение времени года в которое рождается человек, на его психические особенности. Оценка психических особенностей производилась по результатам соционического теста из приложения VK, которое насчитывает более 500000 пользователей. Надёжность и валидность теста небольшая, да и вся соционическая модель имеет ряд проблем. Но нам важно другое: понять есть ли хоть какие-то отличия между людьми родившимися в разное время. Объём выборки в полмиллиона человек позволяет надеяться на положительный результат. В ходе исследования ожидалось получить линейную зависимость между продолжительностью светлого времени суток в день рождения человека и его психотипом, но получилось Читать полностью »

Конкурс рекомендательных систем MSD Challenge

2012-05-03 в 9:33, admin, рубрики: challenge, data mining, Алгоритмы, конкурс, музыка, Программирование, рекомендательные системы, метки: challenge, data mining, конкурс, музыка, рекомендательные системы

26 апреля стартовал конкурс рекомендательных систем Million Song Dataset Challenge. Завершение — через три месяца, 9 августа. В ходе конкурса нужно построить систему, которая по 100% истории прослушивания музыки для 1М пользователей и 50% истории для 100К пользователей сможет максимально точно достроить недостающие 50%. При этом доступны не только данные по прослушиванию, но и обширная база метаданных и даных по контенту от The EchoNest, MusicXMatch и Last.fm. При желании можно пользоваться любыми другими данными (у многих других музыкальных сервисов есть API, через который можно выудить ценную информацию).

Организаторы — CAL UCSD, LabROSA CU, IMIRSEL и UIUC.

Как такового приза у конкурса нет, но компания Zvooq решила сделать его чуть более интересным для российских участников. Лучшая команда из России (вне зависимости от абсолютного места) получит $5000 и возможность бесплатно отправить одного участника на ISMIR 2012.

Условия получения этого бонуса — все участники команды должны проживать в РФ, должно быть опубликовано описание используемого подхода (например, на Хабре или arxiv.org), команда должна заявить о себе на challenge@zvooq.com.

Читать полностью »

Как получить у инвестора деньги без утюга и резиновой дубинки?

2012-04-19 в 9:39, admin, рубрики: data mining, Блог компании Digital October, венчурный капитал, Идеи для стартапов, инвестирование, облачные сервисы, советы, стартап, стартапы, метки: data mining, венчурный капитал, инвестирование, облачные сервисы, советы, стартап

Джефф Байер и Джон Файбер — умудрённые опытом советники AlmazCapital и Almaz Venture Capital, которым за год приходит около 3500 заявок. Они выбирают из них 5 или 10 штук, а остальные аккуратно опускают в мусорную корзину.

Недавно они рассказали, что именно ждёт инвестор от заявки, и куда сейчас наиболее интересно смотреть в плане развития.

Как получить у инвестора деньги без утюга и резиновой дубинки?
КДПВ: в топике помогают зарабатывать такие штуки

Data Mining необычайно рулит

Самый интересный сегмент сегодня — это «большие данные». Дело в том, что объем данных, который генерируется и используется человечеством, растет в геометрической прогрессии. Эти данные надо уметь обрабатывать. Любая крупная компания так или иначе сталкивается с делом обработки больших массивов данных, потому что только тогда они становятся коммерческой информацией. Читать полностью »

Клиентская аналитика: Большой Брат знает, что ты купишь завтра и когда сменишь провайдера

2012-04-10 в 7:46, admin, рубрики: CRM, data mining, аналитика, бизнес-процессы, Блог компании КРОК, клиенты, маркетинг, продажи, управление проектами, эффективность, метки: crm, data mining, аналитика, бизнес-процессы, клиенты, маркетинг, продажи, эффективность

Если вы знаете, что один из ваших клиентов завтра проснётся с мыслью о покупке нового планшета — можно уже сегодня прислать ему письмо с кодом на скидку. Если вы понимаете, что по всем признакам клиент собирается перейти к другому провайдеру — можно повысить ему скорость, снизить цену или предложить что-то ещё. Это клиентская аналитика.

Если вы не знаете, какой тарифный план из трёх предложенных стоит запустить по всей стране, надо воспользоваться клиентской аналитикой, которая возьмёт каждого отдельного человека из базы, оценит эмоциональные и практические мотивы перехода – и позволит понять, сколько людей будут пользоваться этим тарифом.

Именно так выглядит Data Mining в клиентской аналитике. И именно так это уже работает на практике в сотнях крупных компаний по всему миру и в нашей стране.

Клиентская аналитика: Большой Брат знает, что ты купишь завтра и когда сменишь провайдера

Читать полностью »

Computer Science Center. Год номер два

2012-04-05 в 6:08, admin, рубрики: computer science, data mining, software engineering, обучение, Программирование, Учебный процесс в IT, ШАД, метки: computer science, data mining, software engineering, обучение, Программирование, шад

Computer Science Center. Год номер два
Почти год назад мы объявили об открытии Computer Science Center. Сегодня мы начинаем новый набор, и это хороший повод проанализировать наш старт.

Читать полностью »

Программа «Рыбка» решила королевский гамбит

2012-04-03 в 11:10, admin, рубрики: data mining, IBM POWER 7, высокая производительность, шахматы, метки: IBM POWER 7, шахматы

Запустив шахматную программу Rybka на рабочей станции IBM POWER 7 с 2800 ядрами, автор программы сумел решить королевский гамбит — один из самых сложных и острых дебютов шахматной партии, который активно использовали Борис Спасский и Бобби Фишер. Компьютерная программа рассчитала исход всех вариантов развития шахматной партии и пришла к неожиданным результатам.

Программа «Рыбка» решила королевский гамбит

Оказывается, в случае принятия чёрными жертвы на f4 у белых остаётся только один ход, который ведёт в ничьей (в случае идеальной игры с обеих сторон) — слон на e2. Во всех остальных случаях белые получают мат.
Читать полностью »

Алгоритмы сегментации текста

2012-04-02 в 7:36, admin, рубрики: clojure, data mining, machine learning, nlp, обработка текста, метки: clojure, machine learning, nlp, обработка текста

Здравствуйте.

В контексте анализа данных из твиттера возникла задача обработки хештегов. Нужно было взять хештег и разбить его на отдельные слова (#habratopic => habra topic). Задача казалась примитивной, но, получается, я ее недооценил. Пришлось перебрать несколько алгоритмов пока не было найдено то, что надо.

Эту статью можно считать некой хронологией решения задачи с анализом преимуществ и недостатков каждого из использованных алгоритмов. Поэтому, если вам интересна данная тема, прошу под кат.

Читать полностью »

Нечеткий кластерный анализ на примере социально-экономических показателей крупных городов России

2012-04-02 в 2:37, admin, рубрики: data mining, Алгоритмы, города, кластерный анализ, метки: города, кластерный анализ

Введение

Кластерный анализ — задача разбиения определенного множества объектов на группы, называемые кластерами так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались. Данный анализ предполагает следующие цели:

Понимание данных путем выявления кластерной структуры.
Сжатие данных. Если исходная выборка избыточно большая, то можно сократить её, оставив по одному наиболее типичному представителю от каждого кластера.
Обнаружение новизны. Выделяются нетипичные объекты, которые не удаётся присоединить ни к одному из кластеров.

В данной статье будет использоваться метод нечеткой кластеризации c-means. Отличительной особенностью нечеткой кластеризации является тот факт, что каждый объект может относиться к каждому кластеру с определенной степенью принадлежности.

Для анализа будут выбраны 17 крупнейших городов России по населению, в качестве характеристик выступают социально-экономические показатели (демография, занятость населения, зарплата, преступность и т.д.). Результатом будут являться полученные кластеры городов.

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «data mining» - 103

Прогнозирование закупок: адская, но очень полезная математика

Анализ структуры мирового рынка методами теории графов

Астрология и Data mining

Конкурс рекомендательных систем MSD Challenge

Как получить у инвестора деньги без утюга и резиновой дубинки?

Data Mining необычайно рулит

Клиентская аналитика: Большой Брат знает, что ты купишь завтра и когда сменишь провайдера

Computer Science Center. Год номер два

Программа «Рыбка» решила королевский гамбит

Алгоритмы сегментации текста

Нечеткий кластерный анализ на примере социально-экономических показателей крупных городов России

Введение

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «data mining» - 103

Data Mining необычайно рулит

Введение

Новости

Актуальные темы

Архив