Главная

Рубрика «pig»

Hadoop, часть 3: Pig, обработка данных

2014-03-11 в 7:41, admin, рубрики: big data, Hadoop, MapReduce, pig, selectel, Блог компании Селектел, метки: big data, Hadoop, MapReduce, pig, selectel

des-48-5

В предыдущей публикации мы подробно рассмотрели процесс сбора данных при помощи специализированного инструмента Flume. Но чтобы полноценно работать с информацией, мало ее просто собрать и сохранить: ее нужно обработать и извлечь из нее нечто нужное и полезное.

Для обработки данных в Hadoop используется технология MapReduce.
Читать полностью »

Представляем проект Savanna — реализацию Hadoop как услуги для облака OpenStack

2013-05-14 в 8:33, admin, рубрики: Apache, Hadoop, horizon, MapReduce, open source, openstack, pig, rest api, swift, Блог компании Mirantis/OpenStack, метки: apache, Hadoop, horizon, MapReduce, open source, openstack, pig, rest api, swift, мирантис

Автор: Александр Кузнецов

Проект Hadoop – это широко используемая платформа для распределенных вычислений на основе парадигмы MapReduce. В этой статье я рассмотрю сценарии перемещения двух основных компонентов Hadoop в облако OpenStack — инфраструктуры MapReduce и файловой системы HDFS (Hadoop Distributed File System — распределенная файловая система Hadoop). Прототипом названия проекта Savanna стали африканские равнины, по которым перемещаются слоны, изображенные на логотипе Hadoop. Более подробно о проекте рассказывает мой коллега Дмитрий Мещеряков в видео ниже.Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Комментарии

Рекомендуем

Рубрика «pig»

Hadoop, часть 3: Pig, обработка данных

Представляем проект Savanna — реализацию Hadoop как услуги для облака OpenStack