Рубрика «Hadoop» - 9

Lean Big Data на 6 сервисах Google

2014-07-18 в 3:51, admin, рубрики: big data, Big Query, dashboard, Google, google analytics, Google Charts, Hadoop, lean, spreadsheets, visualization, визуализация данных

Здравствуй Хабр! Хочу рассказать как мы делали свою собственную Big Data.

Каждый стартап хочет собрать что-то дешевое, качественное и гибкое. Обычно так не бывает, но у нас, похоже, получилось! Ниже идёт описание нашего решения и много моего сугубо субъективного мнения по этому поводу.

И да, секрет в том, что используется 6 сервисов гугла и собственного кода почти не писалось. Читать полностью »

Microsoft представляет SQL Server 2014 в России!

2014-04-14 в 12:35, admin, рубрики: azure, big data, cloud, Hadoop, hdinsight, Hekaton, Блог компании Microsoft, информационная безопасность, ит-инфраструктура, метки: big data, cloud, Hadoop, hdinsight, Hekaton

Microsoft представляет SQL Server 2014 в России!

Привет!

24 апреля 2014 года состоится ключевое события года в мире серверных и облачный решений – конференция Data Platform Day.

In-Memory OLTP (Hekaton), BIG DATA, Power BI, Microsoft Azure HDInsight и другие новейшие технологии работы с данными в трех треках за один день от ведущих экспертов Microsoft, компаний-партнеров и крупнейших российских заказчиков. Всё это будет идти под флагом глобальной стратегии развития Microsoft Cloud OS и универсальной Платформы SQL Server 2014.

Читать полностью »

Hadoop, часть 3: Pig, обработка данных

2014-03-11 в 7:41, admin, рубрики: big data, Hadoop, MapReduce, pig, selectel, Блог компании Селектел, метки: big data, Hadoop, MapReduce, pig, selectel

des-48-5

В предыдущей публикации мы подробно рассмотрели процесс сбора данных при помощи специализированного инструмента Flume. Но чтобы полноценно работать с информацией, мало ее просто собрать и сохранить: ее нужно обработать и извлечь из нее нечто нужное и полезное.

Для обработки данных в Hadoop используется технология MapReduce.
Читать полностью »

Интервью с Сергеем Лукьяновым, техническим лидером проекта OpenStack Savanna

2014-02-25 в 10:08, admin, рубрики: cassandra, diablo, gerrit, hacking, Hadoop, heat, Jeepyb, Nova client, open source, openstack, Oslo, Pbr, swift, Twitter Storm, Блог компании Mirantis/OpenStack, мирантис

Беседовал Рафаэль Кнут (Rafael Knuth)

Представляем вам 10-е интервью из серии бесед с техническими руководителями проектов инициативы OpenStack в блоге Mirantis. Наша цель – обучение как можно большего числа членов технического сообщества и содействие понимаю того, каким образом можно внести вклад в OpenStack и как извлечь выгоду из него. Разумеется, ниже изложена точка зрения интервьюируемого, а не компании Mirantis.Читать полностью »

OpenStack нужна не одна «шляпа»

2014-02-19 в 11:03, admin, рубрики: ceilometer, Hadoop, linux, open source, openstack, red hat, Блог компании Mirantis/OpenStack, мирантис, открытый код, метки: Hadoop, linux, openstack, red hat, мирантис, открытый код

Автор: Ник Чейс

Похоже, становится модным ругать OpenStack. Это естественно, каждая технология испытывает болезнь роста, когда она уже достаточно продвинутая, чтобы люди захотели ее использовать, но не настолько продвинутая, чтобы оправдать 100% ожиданий всех и каждого.Читать полностью »

Настройка маленького кластера Hadoop 2.2.0 с нуля

2013-12-16 в 9:50, admin, рубрики: big data, Hadoop, высокая производительность, метки: Hadoop

Настройка маленького кластера Hadoop 2.2.0 с нуля

В данной статье будет по шагам разобран процесс создания небольшого кластера Hadoop для опытов.

Несмотря на то, что в интернете на иностранных ресурсах есть полно материала про настройку/развертывание Hadoop, большинство из них либо описывают настройку ранних версий (0.X.X и 1.X.X), либо описывают только настройку в режиме single mode/pseudo distributed mode и лишь частично fully distributed mode. На русском языке материала практически нет вовсе.

Когда мне самому понадобился Hadoop, то я далеко не с первого раза смог все настроить. Материал был неактуален, часто попадались конфиги, которые используют deprecated параметры, поэтому использовать их нежелательно. А даже когда все настроил, то задавался многими вопросами, на которые искал ответы. Также встречались похожие вопросы у других людей.

Всем кому интересно, прошу пожаловать по кат.
Читать полностью »

IBM PureData для Hadoop: чем эта система может мне помочь?

2013-12-09 в 7:52, admin, рубрики: big data, Hadoop, IBM, Блог компании IBM, высокая производительность, метки: Hadoop, IBM

IBM PureData для Hadoop: чем эта система может мне помочь? Сегодня в компаниях информация выстраивается и хранится, как правило, несколькими способами и на нескольких платформах. Данные существуют в неструктурированном, неоптимизированном виде, что не позволяет извлекать из них информацию, необходимую для принятия стратегически важных решений. Роль Больших данных в этом сценарии заключается в возможности собирать такую информацию из различных входных данных, структурировать ее и выдавать данные для использования при анализе, при принятии решений и при работе со средствами предиктивной аналитики. Новейшая из систем IBM PureSystems объединяет в себе концепцию «Больших данных» и решение Apache Hadoop, исходя именно из таких задач.
Читать полностью »

Hadoop, часть 2: сбор данных через Flume

2013-11-07 в 11:12, admin, рубрики: big data, Hadoop, selectel, Блог компании Селектел, селектел, метки: big data, Hadoop, selectel, селектел

В предыдущей публикации мы подробно рассмотрели процесс развертывания кластера Hadoop на базе Cloudera. В этой статье мы хотели бы подробно рассказать о методах и инструментах для сбора данных в Hadoop. Загрузить данные в систему можно как с помощью простого копирования в HDFS, так и с помощью специальных инструментов.
Читать полностью »

Кластеры Hadoop по запросу из облака: внутреннее устройство, первые шаги, задачи, Hive

2013-11-06 в 5:13, admin, рубрики: Apache, big data, Hadoop, hdinsight, map reduce, open source, windows azure, Облачные вычисления, облачные сервисы

Некоторое время назад, в рамках конференции Strata + Hadoop World был анонсирован выход в коммерческой эксплуатацию Windows Azure HDInsight — облачного сервиса 100% совместимого с Apache Hadoop. Подробности о истории появления сервиса и его возможностях можно найти в этой статье на Хабре. Об анонсах конференции Strata + Hadoop World можно прочитать в другой свежей статье.

В этой статье речь пойдет о внутреннем устройстве кластеров HDInsight, старте работы с ними и первых задачах и запросах к Hive. В конце статьи приводятся реальные примеры использования Windows Azure HDInsight крупными международными организациями.

Windows Azure HDInsight предлагает следующие преимущества для своих пользователей:

Работа с большими данными с помощью знакомых инструментов: благодаря глубокой интеграции с инструментами бизнес-аналитики от Microsoft, такими как PowerPivot, Power View и Excel, сервис HDInsight позволяет вам легко анализировать ваши данные с помощью возможностей Hadoop. Прозрачно объединяйте данные из различных источников данных, включая HDInsight с помощью Power Query. Легко анализируйте и визуализируйте географические данные с помощью Power Map – новый картографический 3D-инструмент в Excel 2013;
Гибкость – HDInsight предлагает гибкость соответствующую изменениям потребностей вашей организации. С богатый набором скриптов PowerShell вы можете размещать и администрировать кластер Hadoop за считанные минуты вместо привычных часов или даже дней. Если вам нужен кластер большего размера, просто удалите существующий и создайте новый нужного размера в течении нескольких минут без потери каких либо данных;
Hadoop корпоративного уровня: HDInsight предлагает безопасность и управляемость корпоративного уровня. Благодаря выделенному узлу Secure Node, сервис HDInsight помогает обезопасить ваш кластер Hadoop. В дополнение, мы упростили управление вашим кластером Hadoop с помощью внушительного набора скриптов PowerShell;
Богатые возможности для разработчиков: сервис HDInsight предлагает мощные возможности для разработки приложений с богатым выбором языков, включая .NET, Java и другие. Разработчики на платформе .NET могут воспользоваться мощью запросов LINQ to Hive.

Читать полностью »

Дайджест новостей платформы Windows Azure, октябрь 2013

2013-11-05 в 4:25, admin, рубрики: active directory, Hadoop, hdinsight, hyper-v, Service Bus, sql server, Visual Studio, windows azure, Облачные вычисления, разработка, метки: active directory, Hadoop, hdinsight, hyper-v, service bus, sql server, Visual Studio, windows azure

В рамках этого дайджеста новостей облачной платформы Windows Azure собраны основные анонсы для разработчиков, ИТ-профессионалов и для всех специалистов интересующихся облачными технологиями и платформой Windows Azure.

В этом выпуске:

Коммерческая доступность сервиса резервного копирования в облако Windows Azure Backup
Коммерческая доступность cервиса Windows Azure HDInsight (кластеры Hadoop как сервис)
Публичное превью нового сервиса Hyper-V Recovery Manager
Новые возможности работы с виртуальными машинами:
- Удаление дисков;
- Новые уведомления групп доступности;
- Конфигурирование SQL Server AlwaysOn;
Новые функции Active Directory:
- Интеграция и управление сотнями сторонних SaaS-приложений;
- Управление Windows Azure;
Поддержка Windows Azure в SQL Server 2014 CTP2;
Поддержка Windows Server 2012
Windows Azure SDK 2.2
- Поддержка Visual Studio 2013;
- Удаленная отладка облачных сервисов;
- Секционирование сущностей Windows Azure Service Bus;
- Новые библиотеки управления Windows Azure Management Libraries for .NET;
- Новые скрипты PowerShell и новый портал ScriptCenter;
Снижение цен на ВМ с большим объемом памяти
Опубликована предварительная программа конференции Cloud OS Summit

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «Hadoop» - 9

Lean Big Data на 6 сервисах Google

Hadoop, часть 3: Pig, обработка данных

Интервью с Сергеем Лукьяновым, техническим лидером проекта OpenStack Savanna

OpenStack нужна не одна «шляпа»

Настройка маленького кластера Hadoop 2.2.0 с нуля

IBM PureData для Hadoop: чем эта система может мне помочь?

Hadoop, часть 2: сбор данных через Flume

Кластеры Hadoop по запросу из облака: внутреннее устройство, первые шаги, задачи, Hive

Дайджест новостей платформы Windows Azure, октябрь 2013

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «Hadoop» - 9

Новости

Актуальные темы

Архив