Рубрика «data science» - 30

Цифровая экономика и экосистема R

2017-08-14 в 8:55, admin, рубрики: big data, data mining, data science, R

Если смотреть прессу, словосочетание «цифровая экономика» ожидается одним из популярных в ближайшие несколько лет.

Цифровая экономика и экосистема R - 1

Но чтобы от перейти от слов к делу и действительно совершить цифровой скачок необходимо пересмотреть подходы и используемые инструменты. В рамках настоящей публикации, являющейся продолжением предыдущих публикаций, планирую кратко проиллюстрировать, тезис о том, что применение в бизнесе R экосистемы прекрасно вписывается в задачу перехода к цифровой экономике.

Читать полностью »

«Паровозик, который смог!» или «Специализация Машинное обучение и анализ данных», глазами новичка в Data Science

2017-08-08 в 22:30, admin, рубрики: coursera, data science, python, анализ данных, математика, машинное обучение, новичкам, онлайн обучение, статистика, Учебный процесс в IT

Ранее в моей прошлой статье, посвящённой обучению Data Science с нуля, я обещал записаться на специализацию «Машинное обучение и анализ данных», на Coursera и поделится моими впечатлениями о доступности этих знаний для практически абсолютного новичка в области науки о данных. Сказано – сделано! Хотя безусловно, на Хабре уже есть упоминания об этой и аналогичных специализациях, но думаю мои «пять копеек» не помешают.

Цитата из известного фильма в названии статьи и картинка, взяты не случайно, местами мне кажется, что эта специализация доставляла мне почти физическую боль, и было колоссальное желание все бросить, но интерес в итоге взял верх. Поэтому если вам интересно как я с минимально возможными финансовыми затратами прошел эту серию курсов — милости прошу под кат.

«Паровозик, который смог!» или «Специализация Машинное обучение и анализ данных», глазами новичка в Data Science - 1

Читать полностью »

Лекция Владимира Игловикова на тренировке Яндекса по машинному обучению

2017-08-06 в 14:18, admin, рубрики: data science, jaccard, kaggle, object detection, ods, Блог компании Яндекс, классификация, конкурс, машинное обучение, нейронные сети, ненормальное программирование, Спортивное программирование

Скорее всего, вы слышали об авторе этой лекции. Владимир ternaus Игловиков занял второе место в британском Data Science Challenge, но организаторы конкурса не стали выплачивать ему денежный приз из-за его российского гражданства. Затем наши коллеги из Mail.Ru Group взяли выплату приза на себя, а Владимир, в свою очередь, попросил перечислить деньги в Российский Научный Фонд. История получила широкий охват в СМИ.

Спустя несколько недель Владимир выступил на одной из тренировок Яндекса по машинному обучению. Он рассказал о своём подходе к участию в конкурсах, о сути Data Science Challenge и о решении, которое позволило ему занять второе место.

Читать полностью »

«Data mining сейчас — это преимущество на рынке»: о конференции SmartData и больших данных

2017-07-26 в 14:01, admin, рубрики: big data, data science, smart data, smartdataconf, Блог компании JUG.ru Group, Виталий Худобахшов, конференция, открытые данные, Роман Поборчий

«Data mining сейчас — это преимущество на рынке»: о конференции SmartData и больших данных - 1

Конференции, посвящённые одной и той же теме, могут выглядеть совершенно по-разному. И когда планируется совсем новое мероприятие, заранее не вполне понятно, чего ожидать. Если конференция посвящена «большим и умным данным», то не окажется ли она рассчитана на гигантские компании, где сотрудникам маленьких делать нечего? И не будет ли там такого уклона в data science, что людям без учёной степени лучше не заходить?

В ожидании конференции SmartData, которая впервые состоится в Санкт-Петербурге 21 октября, мы решили внести ясность и расспросили двух членов её программного комитета: Виталия Худобахшова (Одноклассники) и Романа p0b0rchy Поборчего. Они развеяли многие опасения, а разговор получился не только о конференции, но и о состоянии индустрии: что сейчас происходит вокруг machine learning, зачем маленьким компаниям лезть в data mining и почему менеджеры тоже покупают билеты на техническую конференцию обо всём этом.

Читать полностью »

A!Hack Summer — хакатон Альфа-Банка 5 и 6 августа 2017

2017-07-20 в 12:01, admin, рубрики: AR/VR, artificial intelligence, data science, machine learning, Альфа, альфа-лаборатория, альфабанк, Блог компании «Альфа-Банк», финансы в IT, хакатон, Хакатоны

Привет! 5 и 6 августа мы будем проводить внешний летний хакатон “A!Hack Summer”.

Если вам интересны такие вещи как Artificial Intelligence, Machine Learning, AR/VR, Data Science, вы умеете с ними работать и подумывали сделать что-то свое или знаете, как на базе этого сделать продукт для клиентов банка — заходите в Deworkacy (Москва, Берсеневская наб. 6 стр. 3) 5 и 6 августа.

А о том, для чего мы все это делаем, расскажет Владимир Урбанский, руководитель Альфа-Лаборатории.
Читать полностью »

Машинное обучение и поиск темной материи: соревнование от ЦЕРНа и Яндекса

2017-07-17 в 11:47, admin, рубрики: big data, data science, kaggle, physics, python, Блог компании Яндекс, машинное обучение, Программирование

Яндекс уже несколько лет сотрудничает с ЦЕРНом. Он сделал для учёных-физиков поиск по событиям в БАК, предоставил свои вычислительные ресурсы и технологии обработки данных — в том числе Матрикснет и ClickHouse. В 2014 году Яндекс стал ассоциированным членом CERN openlab.

Школа анализа данных Яндекса тоже принимает участие в экспериментах ЦЕРНа. Машинное обучение в наши дни становится «микроскопом» для современных учёных, которым необходимо изучать большие объемы данных и находить в них различные закономерности. В этом году ШАД совместно с лабораторией Методов анализа больших данных Вышки и Имперским колледжем Лондона организует в Великобритании международную школу, которая посвящена способам применения современных технологий в научных исследованиях.

Эксперимент OPERA — из Швейцарии в Италию (картинка взята с сайта коллаборации OPERA)

Сегодня в рамках школы начинается открытое соревнование, участники которого будут ни много ни мало искать нейтрино. Принять участие в поисках мы приглашаем всех желающих. Им предстоит обрабатывать данные с международного эксперимента OPERA. Для этого будут предоставлены исходные данные — результаты сканирования слоев фотопленок одного «кирпича» эксперимента OPERA. Соревнование состоит из двух этапов. На первом этапе участники будут искать отдельный ливень в «кирпиче», первая вершина которого известна, на втором — несколько ливней, рассредоточенных по объему «кирпича» без дополнительной информации. Победители смогут рассказать о своих решениях ученым, работающим в ЦЕРНе.

Читать полностью »

Можно ли уехать из Клинцов? (data mining of blablacar.ru)

2017-07-17 в 6:43, admin, рубрики: BlaBlacar, data mining, data science, R, визуализация данных, метки: Визуализация данных

Парсинг сайта blablacar.ru и анализ пассажиропотока из г. Клинцы Брянской области с помощью языка программирования R.

Читать полностью »

Делаем data science-портфолио: история через данные

2017-07-01 в 10:13, admin, рубрики: data mining, data science, python, визуализация данных, математика

Предисловие переводчика

Перевод внезапно удачно попал в струю других датасайенсных туториалов на хабре. :)
Этот написан Виком Паручури, основателем Dataquest.io, где как раз и занимаются подобного рода интерактивным обучением data science и подготовкой к реальной работе в этой области. Каких-то эксклюзивных ноу-хау здесь нет, но очень подробно рассказан процесс от сбора данных до первичных выводов о них, что может быть интересно не только желающим составить резюме на data science, но и тем, кто просто хочет попробовать себя в практическом анализе, но не знает, с чего начать.

Data science-компании всё чаще смотрят портфолио, когда принимают решение о приёме на работу. Это, в частности, из-за того, что лучший способ судить о практических навыках — именно портфолио. И хорошая новость в том, что оно полностью в вашем распоряжении: если постараетесь – сможете собрать отличное портфолио, которым будут впечатлены многие компании.

Читать полностью »

«Айсберг вместо Оскара!» или как я пробовал освоить азы DataScience на kaggle

2017-06-29 в 23:30, admin, рубрики: data science, kaggle, python, аналитика данных, обучение без учителя, обучение онлайн, Учебный процесс в IT

В моей прошлой статье посвящённой освоению науки о данных (или по заграничному — Data Science) с абсолютного нуля (даже ниже чем -273 градуса по Кельвину) я обещал, что подготовлю материал о том, как я осваивал kaggle (буду писать с маленькой буквы, как у них на логотипе).

Для тех, кто так же, как и я только начинает знакомится с данным вопросом, поясню что как я понял kaggle это сайт, посвящённый соревнованиям и в некоторой степени обучению в области Data Science, где каждый может совершенно бесплатно и используя любые доступные инструменты, сделать прогноз по той или иной задаче.

Слов на ветер бросать не люблю, раз уж пообещал, то хочешь не хочешь — пиши, поэтому если вам интересно что же в итоге у меня из всего это вышло прошу под кат.

«Айсберг вместо Оскара!» или как я пробовал освоить азы DataScience на kaggle - 1
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «data science» - 30

Цифровая экономика и экосистема R

«Паровозик, который смог!» или «Специализация Машинное обучение и анализ данных», глазами новичка в Data Science

Лекция Владимира Игловикова на тренировке Яндекса по машинному обучению

«Data mining сейчас — это преимущество на рынке»: о конференции SmartData и больших данных

A!Hack Summer — хакатон Альфа-Банка 5 и 6 августа 2017

Машинное обучение и поиск темной материи: соревнование от ЦЕРНа и Яндекса

Можно ли уехать из Клинцов? (data mining of blablacar.ru)

Рекомендация первого трека для стриминга. Лекция в Яндексе

Делаем data science-портфолио: история через данные

«Айсберг вместо Оскара!» или как я пробовал освоить азы DataScience на kaggle

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «data science» - 30

Новости

Актуальные темы

Архив