Метка «Hadoop» - 2

Вы понимаете Hadoop неправильно

2013-09-18 в 19:16, admin, рубрики: big data, Hadoop, MapReduce, высокая производительность, метки: Hadoop, MapReduce

— Мы получаем больше миллиона твитов в день, и наш сервер просто не успевает их обрабатывать. Поэтому мы хотим установить на кластер Hadoop и распределить обработку.

Речь шла о вычислительно тяжёлом сентиментном анализе, поэтому я мог поверить, что у одного сервера действительно не хватает CPU, чтобы справиться с большим потоком твитов.

— А что вы собираетесь делать с уже обработанными данными?
— Скорее всего, мы будем складывать их в MySQL, как делали это раньше, или даже удалять.
— Тогда вам определённо не нужен Hadoop.

Мой бывший коллега был далеко не первым, кто говорил про распределённые вычисления на Hadoop. И каждый раз я видел полное непонимание того, зачем была придумана и разработана эта платформа.

Читать полностью »

Hadoop Tutorial. Пишем свой grep

2013-08-12 в 9:13, admin, рубрики: Apache, big data, Hadoop, hello world, java, MapReduce, метки: big data, Hadoop, hello world, java, MapReduce

Доброго времени суток, дорогое читатели. Не так давно я начал изучать работу с большими данными (Map/Reduce, NoSQL...) и очень быстро узнал о фреймворке с открытым исходным кодом Apache Hadoop, за изучение которого сразу и принялся.

Данный пост рассчитан на новичков, которые тоже не так давно начали изучать Hadoop. В посте будет разобрано небольшое приложение построенное на этом фреймворке(Этакий Hello World!). Кому интересно, добро пожаловать под кат.
Читать полностью »

Hadoop. Подробное руководство. 3-е издание

2013-07-04 в 15:25, admin, рубрики: Hadoop, nosql, Блог компании Издательский дом «Питер», метки: Hadoop

Возможно вы помните пост: Нужна ли книга по Hadoop?, в котором мы хотели узнать ваше мнение, стоит ли издавать эту книгу на русском языке. Прошли положенные 9 месяцев, и мы готовы представить её вашему вниманию.

Встречайте:

Читать полностью »

Hadoop vs Dryad (или ничего личного)

2013-06-10 в 22:59, admin, рубрики: .net, big data, dryad, Hadoop, microsoft research, высокая производительность, метки: big data, dryad, Hadoop, microsoft research

На прошлой неделе на Хабре появилось 2 поста о фреймворке распределенных вычислений от Microsoft Research – Dryad. В частности, подробно были описаны концепции и архитектура ключевых компонентов Dryad – среды исполнения Dryad и языка запросов DryadLINQ.

Логическим завершением цикла статей о Dryad видится сравнение фреймворка Dryad с другими, знакомыми разработчикам MPP-приложений, инструментами: реляционными СУБД (в т.ч. параллельными), GPU-вычислениями и платформой Hadoop.

RDBMS vs Hadoop vs Dryad

Читать полностью »

Представляем проект Savanna — реализацию Hadoop как услуги для облака OpenStack

2013-05-14 в 8:33, admin, рубрики: Apache, Hadoop, horizon, MapReduce, open source, openstack, pig, rest api, swift, Блог компании Mirantis/OpenStack, метки: apache, Hadoop, horizon, MapReduce, open source, openstack, pig, rest api, swift, мирантис

Автор: Александр Кузнецов

Проект Hadoop – это широко используемая платформа для распределенных вычислений на основе парадигмы MapReduce. В этой статье я рассмотрю сценарии перемещения двух основных компонентов Hadoop в облако OpenStack — инфраструктуры MapReduce и файловой системы HDFS (Hadoop Distributed File System — распределенная файловая система Hadoop). Прототипом названия проекта Savanna стали африканские равнины, по которым перемещаются слоны, изображенные на логотипе Hadoop. Более подробно о проекте рассказывает мой коллега Дмитрий Мещеряков в видео ниже.Читать полностью »

Обновление Windows Azure: Hadoop, Dropbox, Mercurial, PhoneGap

2013-03-25 в 10:12, admin, рубрики: big data, DropBox, Hadoop, hdinsight, html5, Mercurial, phonegap, windows azure, метки: DropBox, Hadoop, hdinsight, html5, mercurial, phonegap, windows azure

18 марта Скотт Гатри в своем блоге анонсировал очередные нововведения в облачную платформу Windows Azure. Представленный новый функционал включает в себя:

HTML5-клиенты (CORS) для Windows Azure Mobile Services, включая доступ из поппулярной библиотеки PhoneGap;
улучшенная поддержка Windows Phone 7.5, новые библиотеки и пакет Nuget;
поддержка размещения веб-сайтов из Mercurial (Bitbucket, Codeplex) и Dropbox;
новые шаблоны в Web Sites;
публичный доступ к сервису HDInsight – облачной платформе Hadoop как сервис.

Ниже о этих нововведениях чуть подробнее.

Поддержка HTML5/JS-клиентов и PhoneGap в Mobile Services

Windows Azure Mobile Services предлагает облачную инфраструктуру для всех популярных мобильных платформ: Windows 8, Windows Phone, iOS и Android. В текущем обновлении к поддержке мобильных платформ добавилась поддержка веб-клиентов на HTML5/JS, в частности популярной библиотеки PhoneGap. Теперь вы можете получить доступ ко всем данным сохраненным из мобильных клиентов через код написанный на HTML5/JS.
Читать полностью »

MapReduce для обработки слабоструктурированных данных в HDInsight

2013-03-18 в 4:18, admin, рубрики: azure, Hadoop, Блог компании Microsoft, метки: azure, Hadoop

В данном примере мы разберем создание и выполнение типового задания MapReduce в облачной реализации Hadoop от Microsoft, которая носит название HDInsight.
В предыдущем примере мы создали 3-узловой кластер Hadoop и загрузили абстрактный журнал слабоструктурированного формата, который сейчас предстоит обработать. Журнал представляет собой в общем случае большой (в нашем конкретном примере маленький, но на принципиальную демонстрацию идеи это не влияет) текстовый файл, содержащий строки с признаками TRACE, DEBUG, INFO, WARN, ERROR, FATAL. Наша элементарная задача будет состоять в том, чтобы подсчитать количество строк с каждым признаком, т.е. сколько раз возникала ситуация WARN, сколько ERROR и т.д.
Читать полностью »

Дата-майнинг для информационной безопасности

2013-02-02 в 7:07, admin, рубрики: data mining, Hadoop, анализ информации, Блог компании IBM, дата-майнинг, информационная безопасность, метки: Hadoop, анализ информации, дата-майнинг

Дата майнинг для информационной безопасности

На Хабре много писали о суперкомпьютере IBM Watson с зачатками искусственного интеллекта. Предполагается, что такая машина должна служить людям: помогать ставить диагнозы и решать другие сложные проблемы путём анализа массивов структурированных и неструктурированных данных. Но можно ли систему дата-майнинга приспособить для нужд информационной безопасности компании?
Читать полностью »

Big Data – почему это так модно?

2012-12-06 в 7:40, admin, рубрики: big data, Hadoop, MapReduce, Большие данные, большие объемы данных, Песочница, СУБД, хранилища данных, метки: big data, Hadoop, MapReduce, Большие данные, большие объемы данных, СУБД, хранилища данных

Технологии Big Data сегодня очень популярны, о чем говорит хотя бы то, что на текущий момент это наиболее часто встречающийся термин в IT-публикациях. Достаточно посмотреть на статистику таких известных поисковых систем, как Google или Yandex по словосочетанию «Big Data», и становится понятным, что так называемые «Большие Данные» действительно сейчас можно назвать одним из самых востребованных и интересных направлений развития информационных технологий.

Так в чем же секрет популярности этих технологий и что означает термин «Big Data»? Читать полностью »

Нужна ли книга по Hadoop?

2012-10-24 в 14:19, admin, рубрики: Hadoop, nosql, метки: Hadoop

Хотел с Вами посоветоваться. Нужна ли книга по Hadoop?

На Амазоне эта книга привлекла мое внимание, но нет ясности: надо ли издавать её на русском языке?

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Метка «Hadoop» - 2

Вы понимаете Hadoop неправильно

Hadoop Tutorial. Пишем свой grep

Hadoop. Подробное руководство. 3-е издание

Hadoop vs Dryad (или ничего личного)

Представляем проект Savanna — реализацию Hadoop как услуги для облака OpenStack

Обновление Windows Azure: Hadoop, Dropbox, Mercurial, PhoneGap

Поддержка HTML5/JS-клиентов и PhoneGap в Mobile Services

MapReduce для обработки слабоструктурированных данных в HDInsight

Дата-майнинг для информационной безопасности

Big Data – почему это так модно?

Нужна ли книга по Hadoop?

Архив

Информация

Обсуждаемое

Рекомендуем

Метка «Hadoop» - 2

Поддержка HTML5/JS-клиентов и PhoneGap в Mobile Services

Новости

Актуальные темы

Архив