Метка «Hadoop»

Oracle vs Teradata vs Hadoop

2014-09-03 в 8:33, admin, рубрики: big data, dwh, Hadoop, oracle, teradata, хранение данных, метки: dwh, Hadoop, oracle, teradata

Эта статья нацелена на Большие и Очень большие Хранилища Данных, но для ровной картины в классификации немного упомянуты и маленькие.

Статья написана для специалистов, которые ценят главный критерий работы с базами данными — скорость. Речь пойдет о системах, нацеленных на грубый full scan (ораклисты уже напряглись, а терадатовцы радуются).

Давайте рассмотрим, под какой объем данных и работ лучше всего подходит Oracle или Hadoop/NoSQL.
Читать полностью »

Microsoft представляет SQL Server 2014 в России!

2014-04-14 в 12:35, admin, рубрики: azure, big data, cloud, Hadoop, hdinsight, Hekaton, Блог компании Microsoft, информационная безопасность, ит-инфраструктура, метки: big data, cloud, Hadoop, hdinsight, Hekaton

Microsoft представляет SQL Server 2014 в России!

Привет!

24 апреля 2014 года состоится ключевое события года в мире серверных и облачный решений – конференция Data Platform Day.

In-Memory OLTP (Hekaton), BIG DATA, Power BI, Microsoft Azure HDInsight и другие новейшие технологии работы с данными в трех треках за один день от ведущих экспертов Microsoft, компаний-партнеров и крупнейших российских заказчиков. Всё это будет идти под флагом глобальной стратегии развития Microsoft Cloud OS и универсальной Платформы SQL Server 2014.

Читать полностью »

Hadoop, часть 3: Pig, обработка данных

2014-03-11 в 7:41, admin, рубрики: big data, Hadoop, MapReduce, pig, selectel, Блог компании Селектел, метки: big data, Hadoop, MapReduce, pig, selectel

des-48-5

В предыдущей публикации мы подробно рассмотрели процесс сбора данных при помощи специализированного инструмента Flume. Но чтобы полноценно работать с информацией, мало ее просто собрать и сохранить: ее нужно обработать и извлечь из нее нечто нужное и полезное.

Для обработки данных в Hadoop используется технология MapReduce.
Читать полностью »

OpenStack нужна не одна «шляпа»

2014-02-19 в 11:03, admin, рубрики: ceilometer, Hadoop, linux, open source, openstack, red hat, Блог компании Mirantis/OpenStack, мирантис, открытый код, метки: Hadoop, linux, openstack, red hat, мирантис, открытый код

Автор: Ник Чейс

Похоже, становится модным ругать OpenStack. Это естественно, каждая технология испытывает болезнь роста, когда она уже достаточно продвинутая, чтобы люди захотели ее использовать, но не настолько продвинутая, чтобы оправдать 100% ожиданий всех и каждого.Читать полностью »

Настройка маленького кластера Hadoop 2.2.0 с нуля

2013-12-16 в 9:50, admin, рубрики: big data, Hadoop, высокая производительность, метки: Hadoop

Настройка маленького кластера Hadoop 2.2.0 с нуля

В данной статье будет по шагам разобран процесс создания небольшого кластера Hadoop для опытов.

Несмотря на то, что в интернете на иностранных ресурсах есть полно материала про настройку/развертывание Hadoop, большинство из них либо описывают настройку ранних версий (0.X.X и 1.X.X), либо описывают только настройку в режиме single mode/pseudo distributed mode и лишь частично fully distributed mode. На русском языке материала практически нет вовсе.

Когда мне самому понадобился Hadoop, то я далеко не с первого раза смог все настроить. Материал был неактуален, часто попадались конфиги, которые используют deprecated параметры, поэтому использовать их нежелательно. А даже когда все настроил, то задавался многими вопросами, на которые искал ответы. Также встречались похожие вопросы у других людей.

Всем кому интересно, прошу пожаловать по кат.
Читать полностью »

IBM PureData для Hadoop: чем эта система может мне помочь?

2013-12-09 в 7:52, admin, рубрики: big data, Hadoop, IBM, Блог компании IBM, высокая производительность, метки: Hadoop, IBM

IBM PureData для Hadoop: чем эта система может мне помочь? Сегодня в компаниях информация выстраивается и хранится, как правило, несколькими способами и на нескольких платформах. Данные существуют в неструктурированном, неоптимизированном виде, что не позволяет извлекать из них информацию, необходимую для принятия стратегически важных решений. Роль Больших данных в этом сценарии заключается в возможности собирать такую информацию из различных входных данных, структурировать ее и выдавать данные для использования при анализе, при принятии решений и при работе со средствами предиктивной аналитики. Новейшая из систем IBM PureSystems объединяет в себе концепцию «Больших данных» и решение Apache Hadoop, исходя именно из таких задач.
Читать полностью »

Hadoop, часть 2: сбор данных через Flume

2013-11-07 в 11:12, admin, рубрики: big data, Hadoop, selectel, Блог компании Селектел, селектел, метки: big data, Hadoop, selectel, селектел

В предыдущей публикации мы подробно рассмотрели процесс развертывания кластера Hadoop на базе Cloudera. В этой статье мы хотели бы подробно рассказать о методах и инструментах для сбора данных в Hadoop. Загрузить данные в систему можно как с помощью простого копирования в HDFS, так и с помощью специальных инструментов.
Читать полностью »

Дайджест новостей платформы Windows Azure, октябрь 2013

2013-11-05 в 4:25, admin, рубрики: active directory, Hadoop, hdinsight, hyper-v, Service Bus, sql server, Visual Studio, windows azure, Облачные вычисления, разработка, метки: active directory, Hadoop, hdinsight, hyper-v, service bus, sql server, Visual Studio, windows azure

В рамках этого дайджеста новостей облачной платформы Windows Azure собраны основные анонсы для разработчиков, ИТ-профессионалов и для всех специалистов интересующихся облачными технологиями и платформой Windows Azure.

В этом выпуске:

Коммерческая доступность сервиса резервного копирования в облако Windows Azure Backup
Коммерческая доступность cервиса Windows Azure HDInsight (кластеры Hadoop как сервис)
Публичное превью нового сервиса Hyper-V Recovery Manager
Новые возможности работы с виртуальными машинами:
- Удаление дисков;
- Новые уведомления групп доступности;
- Конфигурирование SQL Server AlwaysOn;
Новые функции Active Directory:
- Интеграция и управление сотнями сторонних SaaS-приложений;
- Управление Windows Azure;
Поддержка Windows Azure в SQL Server 2014 CTP2;
Поддержка Windows Server 2012
Windows Azure SDK 2.2
- Поддержка Visual Studio 2013;
- Удаленная отладка облачных сервисов;
- Секционирование сущностей Windows Azure Service Bus;
- Новые библиотеки управления Windows Azure Management Libraries for .NET;
- Новые скрипты PowerShell и новый портал ScriptCenter;
Снижение цен на ВМ с большим объемом памяти
Опубликована предварительная программа конференции Cloud OS Summit

Читать полностью »

Windows Azure и Hadoop: «дружба», готовая к Enterprise

2013-11-04 в 16:32, admin, рубрики: big data, Hadoop, hdinsight, windows azure, YARN, Облачные вычисления, метки: big data, Hadoop, hdinsight, windows azure, YARN

За последние пол месяца произошло 3 ИТ-события, лежащие в плоскости Big Data, Cloud Computing и на их симбиозе. По странному стечению обстоятельств эти события остались без должного внимания как со стороны хабросообщества, так и со стороны немногочисленных профессиональными сообществ в LinkedIn и Facebook.

Эти событий — конференция Strata + Hadoop World, релиз стабильной версии Hadoop 2.2.0 и облачного сервиса Windows Azure HDInsight. О косвенной и прямой связи этих событий речь и пойдет ниже.

Также ниже я приведу ссылки на ресурсы, которые будут более полезными, чем любой вольных пересказ содержимого этих ресурсов.

HDInsight Ecosystem
Читать полностью »

HBase, загрузка больших массивов данных через bulk load

2013-09-26 в 16:43, admin, рубрики: big data, BigData, Hadoop, java, метки: BigData, Hadoop, java

Привет коллеги.
Хочу поделиться своим опытом использования HBase, а именно рассказать про bulk loading. Это еще один метод загрузки данных. Он принципиально отличается от обычного подхода (записи в таблицу через клиента). Есть мнение, что с помощью bulk load можно очень быстро загружать огромные массивы данных. Именно в этом я решил разобраться.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Метка «Hadoop»

Oracle vs Teradata vs Hadoop

Hadoop, часть 3: Pig, обработка данных

OpenStack нужна не одна «шляпа»

Настройка маленького кластера Hadoop 2.2.0 с нуля

IBM PureData для Hadoop: чем эта система может мне помочь?

Hadoop, часть 2: сбор данных через Flume

Дайджест новостей платформы Windows Azure, октябрь 2013

Windows Azure и Hadoop: «дружба», готовая к Enterprise

HBase, загрузка больших массивов данных через bulk load

Архив

Информация

Обсуждаемое

Рекомендуем

Метка «Hadoop»

Новости

Актуальные темы

Архив