Рубрика «data science» - 19

Вия, Уая, Вая, Вайя – “трудности перевода”, или что скрывается за новой платформой SAS Viya (Вайя)

2018-12-28 в 10:25, admin, рубрики: big data, cloud computing, data mining, data science, visual analytics, Блог компании SAS, визуализация данных, Облачные вычисления

Вия, Уая, Вая, Вайя – “трудности перевода”, или что скрывается за новой платформой SAS Viya (Вайя) - 1

В сети можно найти огромное количество разнообразных статей о методах использования алгоритмов математической статистики, о нейронных сетях и в целом о пользе машинного обучения. Данные направления способствуют существенному улучшению жизни человека и светлому будущему роботов. Например, заводы нового поколения, способные работать полностью или частично без вмешательства человека или машины с автопилотом.

Разработчики объединяют комбинации этих подходов и методов машинного обучения в различные направления. Эти направления впоследствии получают названия, оригинальные и не очень, например: IOT (Internet Of Things), WOT (Web Of Things), Индустрия 4.0 (Industry 4.0), Artificial Intelligence (AI) и другие. Данные концепции объединяет то, что их описание является верхнеуровневым, то есть не рассматриваются ни конкретные инструменты и технологии, ни уже готовые к внедрению системы, а основной целью является визуализация желаемого результата. Но технологии уже существуют, хотя часто не имеют единой платформы.
Читать полностью »

4 секрета, как не потерять работу в data science

2018-12-24 в 14:29, admin, рубрики: analytics, big data, data science, Блог компании Нетология, Карьера в IT-индустрии, нетология

Коммерческий автор и переводчик Полина Кабирова специально для Нетологии адаптировала статью американского аналитика Тавиша Шриваставы о том, как процесс автоматизации влияет на data scientist.

Введение

Автоматизация влияет на профессиональную деятельность во всех отраслях. С одной стороны, автоматизация помогает эффективнее управлять бизнесом, а с другой – ведет к постоянному изменению набора необходимых навыков.
Несоответствие необходимому набору навыков приводит к потере работы. Проиллюстрирую эту мысль двумя сценариями.

Сценарий 1 – Ручной труд

4 секрета, как не потерять работу в data science - 1
Читать полностью »

Как с помощью компьютерного зрения оценить состояние автомобиля. Опыт Яндекс.Такси

2018-12-19 в 8:10, admin, рубрики: computer vision, data mining, data science, Алгоритмы, Блог компании Яндекс, машинное обучение, обработка изображений, такси

Как с помощью компьютерного зрения оценить состояние автомобиля. Опыт Яндекс.Такси - 1

Мы стремимся к тому, чтобы после заказа такси к пользователю приезжал чистый, исправный автомобиль той марки, того цвета и с тем номером, которые отображаются в приложении. И для этого мы используем дистанционный контроль качества (ДКК).

Сегодня я расскажу читателям Хабра о том, как с помощью машинного обучения снизить затраты на контроль качества в быстро растущем сервисе с сотнями тысяч машин и не выпустить на линию машину, которая не соответствует правилам сервиса.

Читать полностью »

Приглашаем 22 декабря на Data Ёлку

2018-12-17 в 7:35, admin, рубрики: big data, computer vision, data science, deep learning, machine learning, mail.ru group, Moscow Data Science, ods, Блог компании Mail.Ru Group, искусственный интеллект, конференции, машинное обучение

Приглашаем 22 декабря на Data Ёлку - 1

Приглашаем 22 декабря присоединиться к команде Data Science-специалистов и вместе подвести итоги года. На встрече мы вместе подытожим, что нового было в разных областях Data Science в 2018-м, обсудим последние новости с NIPS/NeurIPS, ответим на самые актуальные вопросы от участников сообщества, а главное — наградим тех, чей вклад в сообщество ODS стал значимым за последний год.
Читать полностью »

Открытый урок «Feature Engineering на примере классического датасета Титаника»

2018-12-13 в 15:41, admin, рубрики: big data, data mining, data science, data scientist, feature engineering, Блог компании Отус, Программирование

И снова привет!

В декабре у нас стартует обучение очередной группы «Data scientist», поэтому открытых уроков и прочих активностей становится всё больше. Например, буквально на днях прошёл вебинар под длинным названием «Feature Engineering на примере классического датасета Титаника». Его провёл Александр Сизов — опытный разработчик, кандидат технических наук, эксперт по Machine/Deep learning и участник различных коммерческих международных проектов, связанных с искусственным интеллектом и анализом данных.

Открытый урок занял около полутора часов. В ходе вебинара преподаватель рассказал про подбор признаков, преобразование исходных данных (кодирование, масштабирование), настройку параметров, обучение модели и много чего ещё. В процессе проведения урока участникам показывалась тетрадь Jupyter Notebook. Для работы использовались открытые данные с платформы Kaggle (классический датасет про «Титаник», с которого многие начинают знакомство с Data Science). Ниже предлагаем видео и транскрипт прошедшего мероприятия, а тут можно забрать презентацию и коды в юпитеровском ноутбуке.

Читать полностью »

Techday Make IT Real — 17 декабря, Москва

2018-12-10 в 6:01, admin, рубрики: agile, big data, data science, design, machine learning, Qiwi, techday, UX, базы данных, Блог компании QIWI, конференции, микросервисы, разработка серверных приложений, тестирование, Тестирование IT-систем

Привет!

17 декабря (понедельник) мы устраиваем TECHDAY MAKE IT REAL – специально для тех, кто предпочитает красивым речам об инновациях их внедрение.

— На любой конференции вы можете услышать про миллион чужих фантазий о применении современных технологий. Вам расскажут о том, как они создали воздушные замки, о том, как они убивают в них гоблинов и троллей. Все это прекрасно, но это — сказки. Мы же попробуем вам рассказать о том, как это выглядит в действительности.

Кирилл Ермаков

Формально techday будет разделен на две части: основную программу и активности на тематических площадках.

Список спикеров, программа и ссылка на регистрацию — под катом. Участие бесплатное.
Читать полностью »

U-NOVUS 2018: воркшоп

2018-12-06 в 8:42, admin, рубрики: data science, u-novus, Блог компании Цифровой СИБУР, воркшоп, конференции, машинное обучение, Сибур, форум, Хакатоны, юновус

В середине октября в рамках проходящего в Томске молодежного форума U-NOVUS мы провели воркшоп, посвященный Data Science.

Томск в принципе заслуженно пользуется славой города ученых и студентов, все-таки 15 НИИ, 9 вузов и несколько бизнес-инкубаторов — это серьезно. Поэтому мы решили пригласить к участию как студентов, так и экспертов из различных компаний.

Кейс мы давали из жизни (читай — с производства), это была задача по продвинутой аналитике на нефтехимическом предприятии.

О том, как это было — под катом.
Читать полностью »

«Мне кажется, идеи команды – самое важное при разработке продукта»

2018-12-03 в 11:10, admin, рубрики: big data, BigData, data analysis, data mining, data science, data scientist, IT-образование, Блог компании New Professions Lab, управление разработкой

Мы продолжаем серию интервью с выпускниками Newprolab, в которой они рассказывают о своей истории перехода в data science. Истории разные и будут интересны тем, кто задумывается о смене карьерной траектории или о том, как новые знания могут помочь решать в том числе текущие задачи. Недавно встретились с Яной Чаруйской, Product Owner в МТС. Яна рассказала, как она пришла в большие данные, как профессионально росла, вспомнила о своем любимом проекте, подарившем ей помимо знаний и опыта, еще и друзей. Рассказала о рабочей атмосфере в МТС, о проектах, которые делает ее команда, о своей мечте, планах на будущее и пр.

— Яна, расскажи немного о себе и своем бэкграунде.

— Меня зовут Яна Чаруйская, я Product Owner в МТС. Интересуюсь областью Big Data и занимаюсь ею уже порядка двух лет. Если вкратце про мою историю: я закончила ВШЭ по направлению «Бизнес-информатика», училась 6 лет, затем год училась на психолога. Четыре года я проработала в IT-консалтинге, три из них занималась хранилищами данных, витринами данных, построением управленческой отчетности в основном для крупных банков. Последний год в консалтинге занималась машинным обучением и предиктивной аналитикой. Сейчас я работаю в МТС менеджером по продукту, у меня команда из 6 человек, и она растет, в ближайшее время нанимаю еще 7. В целом, компания тоже расширяется, сейчас в МТС более 150 Big Data специалистов и еще открыто множество вакансий (планируем увеличить штат практически в 2 раза!). Мы с командой разрабатываем несколько продуктов одновременно, в настоящий момент они на разных стадиях реализации: есть продукты, которые находятся в стадии R&D, какие-то — в стадии продуктивизации.
Читать полностью »

Искусственный интеллект. Интеллектуальная собственность. Danger

2018-11-30 в 13:52, admin, рубрики: data science, machine learning, neural networks, венчурные инвестиции, интеллектуальная собственность, искусственный интеллект, патентная стратегия, Управление сообществом

Достижения в области искусственного интеллекта у всех на слуху, объемы рынка оцениваются в 1,2 трлн долл. США к концу 2018 года. В пятилетней перспективе большинство специалистов говорит об увеличении рынка чуть ли не на порядок.

И вот совсем лаконичный факт — количество патентов только по точному запросу в наименовании «artificial intelligence»/искусственный интеллект, т.е. даже не принимая в расчет сходные термины «neural network»/нейронные сети, «machine learning»/машинное обучение и пр., по состоянию на начало ноября 2018 г.:

Google (Alphabet) — 1 430 патентов,
Apple — 592 патента,
Китай всего — более 7 000 патентов,
Всего в мире — более 100 тыс. патентов (эти и аналогичные данные можно увидеть и проанализировать на открытом ресурсе Google Patent или других агрегаторах).

И, внимание(!!!):

Россия – 17 патентов (база данных Роспатента, также есть в открытом доступе), содержащих в наименовании термин «искусственный интеллект» и 657 патентов (это с учетом незавершенных и отмененных), содержащих термин «искусственный интеллект» в описании.

Искусственный интеллект. Интеллектуальная собственность. Danger - 1

Читать полностью »

Чем поможет машинное обучение, когда каждая минута на счету. Прогнозируем ETA в Яндекс.Такси

2018-11-29 в 7:40, admin, рубрики: big data, data mining, data science, Алгоритмы, Блог компании Яндекс, машинное обучение, такси

Представьте, что вам надо вызвать такси. Вы открываете приложение, видите, что машина приедет минут через семь, нажимаете «Заказать» — и… автомобиль в 15 минутах от вас, если вообще найден. Согласитесь, неприятно?

Под катом поговорим о том, как методы машинного обучения помогают Яндекс.Такси более качественно прогнозировать ETA (Estimated Time of Arrival — ожидаемое время прибытия).

Чем поможет машинное обучение, когда каждая минута на счету. Прогнозируем ETA в Яндекс.Такси - 1
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «data science» - 19

Вия, Уая, Вая, Вайя – “трудности перевода”, или что скрывается за новой платформой SAS Viya (Вайя)

4 секрета, как не потерять работу в data science

Введение

Сценарий 1 – Ручной труд

Как с помощью компьютерного зрения оценить состояние автомобиля. Опыт Яндекс.Такси

Приглашаем 22 декабря на Data Ёлку

Открытый урок «Feature Engineering на примере классического датасета Титаника»

Techday Make IT Real — 17 декабря, Москва

U-NOVUS 2018: воркшоп

«Мне кажется, идеи команды – самое важное при разработке продукта»

Искусственный интеллект. Интеллектуальная собственность. Danger

Чем поможет машинное обучение, когда каждая минута на счету. Прогнозируем ETA в Яндекс.Такси

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «data science» - 19

Введение

Сценарий 1 – Ручной труд

Новости

Актуальные темы

Архив