Рубрика «big data» - 62

Использование R для «промышленной» разработки

2017-11-13 в 12:05, admin, рубрики: big data, data mining, data science, R

Является продолжением предыдущих публикаций. Не секрет, что при упоминании R в числе используемых инструментов вторым по популярности является вопрос о возможности его применения в «промышленной разработке». Пальму первенства в России неизменно держит вопрос «А что такое R?»

Попробуем разобраться в аспектах и возможности применения R в «промышленной» разработке.

Читать полностью »

Как мозг бьет дерево, или как мы сделали рекомендательную систему с помощью нейронной сети

2017-11-12 в 8:12, admin, рубрики: big data, Блог компании QIWI, большие данные и машинное обучение, машинное обучение, нейронные сети, рекомендательные системы

Как бы вы сделали рекомендательную систему? У многих в голове сразу появилась картина как они импортят и стакают ~~XGBoost~~ CatBoost. Изначально у нас в голове появилась та же картина, но мы решили на волне хайпа сделать это на нейронных сетях, благо времени было много. Опыт их создания, тестирование, результаты и наши мысли описаны далее.

Как мозг бьет дерево, или как мы сделали рекомендательную систему с помощью нейронной сети - 1

Читать полностью »

Татьяна Пучкова, АльфаСтрахование: «Я лично обещаю уделить внимание каждому стартапу»

2017-11-09 в 13:19, admin, рубрики: big data, Insurtech Lab, акселератор, Альфа-страхование, Блог компании Fintech Lab, Развитие стартапа, стартап, страхование, Управление продуктом, управление проектами, финансы в IT

Наше интервью с заместителем генерального директора «АльфаСтрахование» Татьяной Пучковой об особенностях страхового бизнеса, анализе больших данных, телематике, оценке риска, ЗОЖ и первом страховом акселераторе Insurtech Lab’2017.

Татьяна Пучкова, АльфаСтрахование: «Я лично обещаю уделить внимание каждому стартапу» - 1
Читать полностью »

ИИ на Физтехе: цифровая экономика, блокчейн, чат-боты и вот это всё

2017-11-08 в 14:18, admin, рубрики: big data, Блог компании Московский физико-технический институт (МФТИ), диалоговые системы, искусственный интеллект, машинное обучение, МФТИ, Учебный процесс в IT, финансы в IT

Осенью Физтех запустил цикл семинаров по искусственному интеллекту. В ходе обсуждений рассматриваются различные темы мира машинного обучения и технологического предпринимательства: как и почему интеллектуальные системы станут доминирующей частью нашей жизни и экономики в ближайшие годы, какие инициативы и проекты развиваются за рубежом, тренды рынка и как их создавать, что можно разрабатывать вместе с командами лабораторий МФТИ уже сейчас и как втянуться в союз и сотрудничество с «умными» машинами. Материалы курса доступны в Telegram-канале и группе AI@MIPT Вконтакте.

Третья встреча на тему: «Проект iPavlov. Как на Физтехе разрабатывают разговорный искусственный интеллект» состоится 13 ноября в 18:30 в 107 Биокорпуса МФТИ. Для очного участия в семинаре необходимо предварительно зарегистрироваться. Лекция также будет транслироваться онлайн на официальной странице Физтеха Вконтакте.
Читать полностью »

Глобальная теплокарта Strava: теперь в 6 раз горячее

2017-11-08 в 8:30, admin, рубрики: Apache Spark, big data, C, CDF, gps, iphone, Mapbox GL, parquet, s3, scala, Strava, алгоритм Брезенхэма, Алгоритмы, билинейная интерполяция, нормализация, обработка изображений, Проектирование и рефакторинг, теплокарта, функция распределения

Рад объявить о первом крупном обновлении глобальной тепловой карты в Strava Labs c 2015 года. Это обновление включает в себя в шесть раз больше данных, чем раньше — в сумме 1 миллиард активностей со всей базы Strava по сентябрь 2017 года.

Наша глобальная теплокарта — самая крупная и подробная, и это самый прекрасный в мире набор данных такого рода. Это прямая визуализация активностей глобальной сети атлетов Strava. Чтобы дать представление о масштабе, то новая теплокарта включает в себя:

1 миллиард активностей
3 триллиона точек долготы/широты
13 триллионов пикселей после растрирования
10 терабайт исходных данных
Общая дистанция маршрутов: 27 миллиардов километров
Запись общего времени активности: 200 тысяч лет
5% земной суши покрыто тайлами

Глобальная теплокарта Strava: теперь в 6 раз горячее - 1
Тепловая карта Москвы демонстрирует функцию поворота/наклона в Mapbox GL
Читать полностью »

Приглашаем на Sberbank Data Science Day 11 ноября

2017-11-07 в 10:57, admin, рубрики: AI, big data, data science, machine learning, Блог компании Сбербанк, искусственный интеллект, конференции, машинное обучение, Сбербанк

В эту субботу, 11 ноября, мы приглашаем читателей Хабра на однодневную конференцию по Data Science, Machine Learning и AI. Это мероприятие завершит Sberbank Data Science Journey, ежегодные соревнования по интеллектуальному анализу данных с применением передовых математических методов и алгоритмов. В этом году состязание проводилось на первом в своем роде русскоязычном наборе данных.

Мы наградим победителей и послушаем выступления от ведущих исследователей Nate Kushman (MIT, Microsoft Research UK), Дмитрий Ветров (ФКН ВШЭ, Bayes Group), Михаил Бурцев (МФТИ, iPavlov), Евгений Бурнаев (Сколтех, ADASE group) и Александр Тужилин (New York University, Сбербанк AI Lab). Кроме того, на специальной секции про бизнес в AI о пути своих компаний и перспективах монетизации AI расскажут основатели компаний Prisma, NTechLab, Rubbles и Vision Labs.

Подробная программа и ссылка на регистрацию — под катом.

Приглашаем на Sberbank Data Science Day 11 ноября - 1

Читать полностью »

О сборе данных. Как собирать данные, анализировать их и грабить корованы

2017-11-06 в 2:38, admin, рубрики: big data, аналитика, сбор данных, Статистика в IT, черная дыра, Читальный зал

О сборе данных. Как собирать данные, анализировать их и грабить корованы - 1
В предыдущей статье мы рассматривали вопросы качества данных («О качестве данных и распространенных ошибках при их сборе» на Хабре).
Сегодня я хочу продолжить разговор о качестве данных и обсудить их сбор: как правильно расставить приоритеты при выборе источника, как и какие данные собирать, оценка ценности данных для компании и другое.

Собирайте всё

Вы решили улучшить оформление и оплату товара на сайте?
Отлично, а как проходит процесс формирования корзины покупателем? В какой момент он делает окончательный выбор товаров: до добавления в корзину или перед оплатой покупки?
На каждом сайте может быть по разному, но как ведет себя клиент у вас?
При обладании данными об оформлении заказа их можно проанализировать и определиться с вектором обновления, который будет удобен не только вам, но и пользователям.
Читать полностью »

R, Asterisk и платяной шкаф

2017-11-04 в 7:13, admin, рубрики: big data, data mining, data science, R

Является продолжением предыдущих публикаций. Основное назначение публикаций — демонстрация возможностей R по решению различных "рутинных" задач по обработке данных, возникающих в бизнесе. Основной акцент ставится на создание законченного решения для конечного пользователя, а не на принципиальное решение частной задачи набором команд в консоли. Схематический прототип и продукт с конвейера имеют больше различий чем сходства.

По тонкой механике R есть огромное количество специализированных блогов, книг, а также github. Но обращаются к ним обычно только после того, как видят, что решение задачи средствами R возможно и весьма элегантно.

Читать полностью »

Проведение выборов с помощью блокчейна, идентификация пользователя по голосу и приложение для онлайн-собеседований

2017-11-02 в 8:33, admin, рубрики: big data, Блог компании Innopolis University, индустрия ит, информационная безопасность, информационные технологии, ит-вуз, студенты, Университет Иннополис

Обучающиеся магистерских программ «Управление разработкой ПО» и «Разработка безопасных систем и сетей» Университета Иннополис помогли решить 16 задач ИТ-компаний.

Читать полностью »

Отличие DAX и MDX

2017-11-01 в 13:06, admin, рубрики: Analysis Services, big data, Business Intelligence, data mining, dax, MDX, Microsoft SQL Server, olap, olap-кубы, sql, sql server, многомерная модель, многомерные кубы, табличная модель

Меня часто спрашивают об основных отличиях DAX и MDX или в целом о различии табличной и многомерной модели.

С точки зрения выражения или языка запросов, одно из наиболее важных различий лежит во внутренней основе обоих подходов.

В кубе, для адресации ячейки в пространстве, у нас есть понятие кортежа. Ось в кортеже устанавливает координаты. Если у нас есть единственный кортеж, то результат — содержание соответствующей ячейки в кубе. Поскольку у атрибутов куба есть элемент All, который служит значением по умолчанию (в большинстве случаев), если атрибут не был включен в кортеж, то мы выполняем агрегацию также, как если бы он там был. Например, следующий кортеж возвращает (агрегированный) объем продаж за 2013 год

(Date.Calendar.[Calendar Year].&[2013], Measures.[Internet Sales Amount])

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «big data» - 62

Использование R для «промышленной» разработки

Как мозг бьет дерево, или как мы сделали рекомендательную систему с помощью нейронной сети

Татьяна Пучкова, АльфаСтрахование: «Я лично обещаю уделить внимание каждому стартапу»

ИИ на Физтехе: цифровая экономика, блокчейн, чат-боты и вот это всё

Глобальная теплокарта Strava: теперь в 6 раз горячее

Приглашаем на Sberbank Data Science Day 11 ноября

О сборе данных. Как собирать данные, анализировать их и грабить корованы

Собирайте всё

R, Asterisk и платяной шкаф

Проведение выборов с помощью блокчейна, идентификация пользователя по голосу и приложение для онлайн-собеседований

Отличие DAX и MDX

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «big data» - 62

Собирайте всё

Новости

Актуальные темы

Архив