Big Data наступают по всем фронтам — их роль растёт в науке, бизнесе, медицине, управлении безопасностью и в экономике. Поэтому каждая из сфер готова на на шутку бороться за лучшие умы специалистов. Среди самых удачных попыток найти самых-самых — важнейшее мировое соревнование в области анализа данных CIKM Cup 2016, который проходит в рамках 25-ой международной конференции CIKM Conf. 2016. Российская технологическая компания DCA, специализирующаяся на работе с большими данными и высоконагруженными системами, на этот раз стала партнером конференции и соревнования. DCA сформировала задачу, которую предстоит решить участникам CIKM Cup 2016, а также обеспечила необходимым набором данных для анализа. Хотите узнать немного больше о задаче и попробовать силы в соревнованиях Data Scientist — вам под кат. Кому как не нам знать, насколько сильны российские специалисты в сфере обработки данных.
Мы ищем своих Брюсов Уиллисов.
Соревнование CIKM Cup 2016 — часть международной научно-практической конференции CIKM 2016, которая пройдет 24-28 октября этого года уже в 25-ый раз и соберет на несколько дней ученых, представителей академических кругов, специалистов и профессионалов в области информационных технологий. Традиционно CIKM проходит в различных городах мира (Балтимор, США, 1992 – Мельбурн, Австралия, 2015), символизируя тем самым трансграничность науки и информационных технологий. В 2016 году конференцию примет город Индианаполис, США.
CIKM 2016 находится на стыке трех направлений науки – информационный поиск, базы данных и управление знаниями. Фокусом CIKM являются сложные междисциплинарные информационные проблемы и глобальные вызовы, стоящие перед академическим сообществом и обществом в целом. Для укрепления взаимодействия между наукой и бизнесом, которое необходимо для ускорения исследования в области Data Science и инноваций в отрасли, в этом году CIKM впервые дополнит программу целым днем, посвященным открытым вакансиям (Career Day), а также представит обширную программу с активным участием представителей индустрии (Industry Track), которая будет работать в течение всех трех дней главной конференции в дополнение к насыщенной научно-исследовательской программе Research Track, уже доказавшей свою эффективность на протяжении 25 лет.
Являясь, по большей части, событием научного, академического мира, CIKM стремится к сближению с реальными прикладными сферами жизни. Именно для этого и проводится соревнование CIKM Cup: IT-компании ставят реальные задачи, а решают их сильнейшие Data Scientists по всему миру.
Соревнование открытое, принять участие может любой желающий из любой страны мира – достаточно зарегистрироваться на сайте и отправить заявку. Каждому участнику предлагается решить две актуальные проблемы:
1. Cross-Device Entity Linking for Online Advertising при поддержке компании DCA (Data-Centric Alliance)
2. Personalized E-commerce Search при поддержке компании DIGINETICA.
Предложенные проблемы связаны с электронной торговлей и онлайн-рекламой — едва ли не первыми отраслями, которые уловили коммерческую ценность больших данных и стали интенсивно развиваться в этом направлении, активно перестраивая и программатик, и таргетинг, и работу с событиями на «рельсы» больших данных. Именно поэтому большую ценность представляет стажировка в компаниях таких отраслей — можно работать с данными собранными как онлайн, так и путём взаимодействия пользователей с элементами интернета вещей (датчики, счётчики, носимая электроника).
Призовой фонд CIKM Cup 2016 составляет $5,000, а в качестве бонуса — возможность пообщаться с ведущими мировыми исследователями по Entity Linking, Online Advertising и Personalized Search из таких организаций, как Microsoft Research, Google Research, IBM Research, Stanford University, UIUC, UC Berkeley и других.
Срок проведения соревнований — с 5 августа по 5 октября 2016 года. Лучшие из предложенных технологических решений будут представлены в рамках CIKM Cup Workshop на CIKM, открыты для всего экспертного сообщества и на сайте CIKM Cup, а также потенциально станут частью решений компаний DCA и DIGINETICA.
Задачи интересные и нетривиальные — поучаствовать стоит хотя бы для того, чтобы на них посмотреть и обратиться к рабочим «живым» данным. Пока не всё потеряно, до 5 октября вы можете присоединиться к соревнованиям и попробовать свои силы в роли Data Scientist. Как минимум, это будет сильным опытом, как максимум — вы присоединитесь к лучшим умам Big Data.
О CIKM говорят
Чэнсян Чжай | Профессор университета Иллинойса, главный сопредседатель CIKM 2016:
«CIKM Cup – одна из важнейших частей CIKM Conference, еще больше усиливающей взаимодействие между наукой и отраслью, предоставляющей уникальные возможности для исследователей и студентов в работе над реальными бизнес-задачами, для изучения сложных проблем, находящих реальное применение в жизни. Мы благодарны организаторам CIKM Cup (Павлу Ижутову и Никите Спирину) за то, что они сумели представить участникам два конкурса, оба из которых отражают реальные вызовы индустрии и предлагают превосходную возможность узнать о Data Science, а также изучить новые идеи по многочисленным темам, имеющим исключительно важное значение для CIKM, в частности, интеллектуального анализа данных, поиска информации, машинного обучения, и обработки естественного языка.
Мы также благодарны партнерам CIKM Cup, компаниям DCA, DIGINETICA, ChaLearn и Microsoft Research за предоставленную инфраструктуру и поддержку, благодаря которой проведение этих двух конкурсов стало возможным. Эти конкурсы — отличный способ интеграции образования, научных исследований и практики в больших данных, с пользой для всех»
Джеймс Шэнахан | Доктор из университета Беркли в Калифорнии, член наблюдательного совета CIKM:
«Для того чтобы быть успешными в современном мире, ученые и специалисты по анализу данных должны постоянно находится в контакте с индустрией и решать прикладные задачи. CIKM Cup 2016 предоставляет участникам уникальную возможность в решении двух таких задач: Cross-Device Entity Linking и Personalized e-Commerce Search. Желаю всем участникам успехов!»
Никита Учителев | Директор по аналитике DCA (Data-Centric Alliance):
«Мир технологий никогда не имел границ – его движущая сила – человеческий ум и стремление к созиданию и объединению. С наступлением эры данных перед нами открываются невероятные возможности для работы, ведения бизнеса, решения социальных задач. Мы в DCA уверены, что только в постоянном контакте с мировым сообществом можно создавать действительно актуальные технологии и мы рады, что стали партнерами такого, без сомнения, легендарного мероприятия, как CIKM Conference»
Dr. Никита Спирин | Исследователь из University of Illinois at Urbana-Champaign, со-организатор CIKM Cup 2016:
«Для представителей академии доступ к данным из индустрии является серьезной проблемой. Соревнования по анализу данных, такие как CIKM Cup, позволяют исследователям из университетов получить доступ к таким уникальным данным, что, в свою очередь, способствует более ускорению прогресса, детальному тестированию научных идей, и, наконец, созданию более полезных и качественных информационных продуктов для конечных пользователей. Как со-организатор CIKM Cup 2016, я очень благодарен партнерам DCA и DIGINETICA за открытое сотрудничество и поддержку международного научного сообщества.»
Павел Ижутов | Аспирант Stanford University, со-организатор CIKM Cup 2016:
«CIKM Cup 2016 — это отличная ежегодная традиция при одной из топовых конференций по анализу данных. Надеюсь, что соревнование, которое мы проводим в этом году, поспособствует новым научным открытиям. Я очень рад быть частью начинания, которое помогает представителям науки и способствует развитию высокотехнологического бизнеса.»
Часть разработок компании лежит в области цифрового маркетинга – от programmatic-закупок для онлайн-рекламы, до технологических интеграций с базами данных компаний-клиентов.
Основная задача DCA – развитие и популяризация идеи «больших данных», идеи, способной изменить наше представление об эффективности бизнеса и качестве жизни.
DCA. Большие данные для большого дела.
Спасибо за внимание и успехов!
Автор: DCA (Data-Centric Alliance)