Рубрика «data science» - 36

«Любое техническое изменение должно отвечать на вопрос «зачем?» — Одноклассники о Java и не только

2016-10-13 в 12:04, admin, рубрики: data mining, data science, highload, java, smart data, unsafe, Блог компании JUG.ru Group, Блог компании Одноклассники, высокая производительность, одноклассники

«Любое техническое изменение должно отвечать на вопрос «зачем?» — Одноклассники о Java и не только - 1

Как в Одноклассниках использование sun.misc.Unsafe сочетается с повышенными требованиями к надёжности? Почему там дорабатывали систему мониторинга Cacti? Как работа в ОК пересекается с научной деятельностью? Если соцсеть называется «Одноклассники», то состоит ли весь её Java-код из одного класса?

Ответы на эти и другие вопросы — в нашем посте. В преддверии Joker, где сразу трое сотрудников ОК будут спикерами, а ещё один участвует в программном комитете, мы расспросили всех четверых — и не только их. На наши вопросы ответили:

Олег Анастасьев, ведущий разработчик (участник программного комитета Joker 2016)
Андрей Паньгин, ведущий разработчик (спикер Joker 2016)
Виталий Худобахшов, ведущий аналитик (спикер Joker 2016)
Дмитрий Бугайченко, инженер-аналитик (спикер Joker 2016)
Андрей Губа, заместитель технического директора
Кристина Штейнберга, руководитель отдела персонала

Читать полностью »

Запрягаем R на службу бизнесу на «1-2-3»

2016-10-03 в 14:07, admin, рубрики: big data, data mining, data science, R

Настоящий пост является является, фактически, резюме, подводящим итоги предыдущих «технологических» публикаций [1, 2, 3, 4, 5] и возникших дискуссий и обсуждений. Последние показали, что задач в которых применение R могло бы оказать хорошую помощь бизнесу очень и очень много. Однако, даже в тех случаях, когда R используется, далеко не всегда для этого применяются современные возможности R.Читать полностью »

Видеозапись вебинара «Инструменты для работы Data Scientist»

2016-09-29 в 10:24, admin, рубрики: algorithms, big data, data mining, data science, deep learning, FlyElephant, Hadoop, HPC, spark, Блог компании FlyElephant, вебинар, высокая производительность, машинное обучение, Облачные вычисления

Видеозапись вебинара «Инструменты для работы Data Scientist» - 1

Вчера наша команда провела вебинар на тему «Инструменты для работы Data Scientist». В его рамках мы рассмотрели, кто такой data scientist и какими инструментами он пользуется. Поговорили о платформе FlyElephant и чем она может быть полезной для работы data scientist’а.
Читать полностью »

Data Science Week 2016. Обзор первого и второго дня

2016-09-26 в 11:18, admin, рубрики: big data, data mining, data science, data science week, Блог компании New Professions Lab, машинное обучение, метки: data science week

Публикуем обзор первых двух дней Data Science Week 2016, в которые наши спикеры говорили о взаимоотношениях с клиентом и внутренней оптимизации.

Читать полностью »

Из физиков в Data Science (Из двигателей науки в офисный планктон). Вторая часть

2016-09-23 в 2:51, admin, рубрики: data science, кремниевая долина, работа в it, стартап, Учебный процесс в IT

Примерно год назад я написал текст о том как у меня происходил процесс перехода из академической среды в популярную ныне профессию Data Scientist. На удивление я получил достаточно много сообщений от людей, которые оказались в похожей ситуации, то есть мой пост нашел свою аудиторию и кому-то оказался полезен. Теперь пришла пара написать продолжение.

(Заранее извиняюсь за обилие английских слов, какие-то из них я не знаю как перевести, а какие-то мне переводить не хочется)

Читать полностью »

Применение R для работы с утверждением «Кто виноват? Конечно ИТ!»

2016-09-15 в 14:40, admin, рубрики: big data, data mining, data science, R

Продолжение предыдущих публикаций «Инструменты DataScience как альтернатива классической интеграции ИТ систем»,
«Экосистема R как инструмент для автоматизации бизнес-задач» и Джентельменский набор пакетов R для автоматизации бизнес-задач. Настоящая публикация преследует 2 цели:

Взглянуть на типичные задачи, которые встречаются в бизнесе, под немного другим углом.
Попробовать их решить, частично или полностью, с использованием средств, предоставляемых R.
Читать полностью »

Джентельменский набор пакетов R для автоматизации бизнес-задач

2016-09-07 в 11:55, admin, рубрики: big data, data mining, data science, R

Продолжение предыдущих публикаций «Инструменты DataScience как альтернатива классической интеграции» и
«Экосистема R как инструмент для автоматизации бизнес-задач».
Настоящая статья является ответом на возникшие вопросы по пакетам R, которые полезны для реализации описанных подходов. Я ее рассматриваю исключительно как справочную информацию, и отправную точку для последующего детального изучения заинтересовавшимися, поскольку за каждым пакетом скрывается огромное пространство со своей философией и идеологией, математикой и путями развития.

Как правило, все пакеты (9109 штук на 07.09.2016) находятся в репозитории CRAN. Те, что по тем или иным причинам, пока не опубликованы в репозиторий, могут быть найдены на GitHub. Итак, кратким списком:Читать полностью »

Экосистема R как инструмент для автоматизации бизнес-задач

2016-09-06 в 14:03, admin, рубрики: big data, data mining, data science, R

Настоящая статья является продолжением предыдущей публикации «Инструменты DataScience как альтернатива классической интеграции». Основная цель — заострить внимание как разработчиков, так и руководителей среднего звена, на широком спектре возможностей, которые предоставляют современные инструменты из сферы Data Science за рамками классических задач статистических вычислений и модной нынче темы машинного обучения. В частности, возможности экосистемы R по состоянию на август 2016 года и применение этих возможностей на примере двух задач: одной из прикладной науки, другой – из среднего бизнеса.
Читать полностью »

Инструменты Data Science как альтернатива классической интеграции

2016-09-05 в 15:04, admin, рубрики: big data, data mining, data science, R

В настоящий момент уже можно считать, что страсти по Big Data и Data Science немного утихли, а ожидание чуда, как обычно, было сильно скорректировано реальностью физического мира. Самое время заняться конструктивной деятельностью. Поиск тем на Хабре по различным ключевым словам выдал крайне скудный набор статей, поэтому я решил поделиться тем опытом, который был накоплен в части практического применения инструментов и подходов Data Science для решения повседневных задач в компании.
Читать полностью »

Визуализация фото-портфолио. Часть 2: Word embedding

2016-09-03 в 15:07, admin, рубрики: data mining, data science, dimensionality reduction, pointwise mutual information, sklearn, SVD, t-sne, word embedding, визуализация данных, машинное обучение

Визуализация портфолио (на данном рисунке, чем краснее область, тем больше среднескачиваемых фото в этой области)

В предыдущей части речь шла о разбиении фото-портфолио по сигналам с предпоследнего слоя модели inceptionV3. В этой части я расскажу, как разбивать портфолио по ключевым словам.Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «data science» - 36

«Любое техническое изменение должно отвечать на вопрос «зачем?» — Одноклассники о Java и не только

Запрягаем R на службу бизнесу на «1-2-3»

Видеозапись вебинара «Инструменты для работы Data Scientist»

Data Science Week 2016. Обзор первого и второго дня

Из физиков в Data Science (Из двигателей науки в офисный планктон). Вторая часть

Применение R для работы с утверждением «Кто виноват? Конечно ИТ!»

Джентельменский набор пакетов R для автоматизации бизнес-задач

Экосистема R как инструмент для автоматизации бизнес-задач

Инструменты Data Science как альтернатива классической интеграции

Визуализация фото-портфолио. Часть 2: Word embedding

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «data science» - 36

Новости

Актуальные темы

Архив