Привет! Мы продолжаем цикл статей, посвященный Apache Flume. В предыдущей части мы поверхностно рассмотрели этот инструмент, разобрались с тем, как его настраивать и запускать. В этот раз статья будет посвящена ключевым компонентам Flume, с помощью которых не страшно манипулировать уже настоящими данными.
Рубрика «хранение данных» - 88
Flume — управляем потоками данных. Часть 2
2016-04-21 в 9:20, admin, рубрики: big data, flume, Hadoop, Анализ и проектирование систем, Блог компании DCA (Data-Centric Alliance), разработка, хранение данныхСравнение производительности Hadoop на DAS и Isilon
2016-04-19 в 6:53, admin, рубрики: DAS, Hadoop, Isilon, Блог компании EMC², высокая производительность, ит-инфраструктура, хранение данных, метки: isilon
Я уже писал о том, с помощью Isilon можно создавать озёра данных, способные одновременно обслуживать по несколько кластеров с разными версиями Hadoop. В той публикации я упомянул, что во многих случаях системы на Isilon работают быстрее, чем традиционные кластеры, использующие DAS-хранилища. Позднее это подтвердили и в IDC, прогнав на соответствующих кластерах различные Hadoop-бенчмарки. И на этот раз я хочу рассмотреть причины более высокой производительности Isilon-кластеров, а также как она меняется в зависимости от распределения данных и балансировки внутри кластеров.
Читать полностью »
Обзор и тест СХД Fujitsu ETERNUS DX 100 S3
2016-04-18 в 12:23, admin, рубрики: ETERNUS DX, Fujitsu, storage, Блог компании Fujitsu, ит-инфраструктура, системное администрирование, хранение данных
Сегодня мы расскажем о масштабируемой системе хранения данных начального уровня DX 100 S3 компании Fujitsu. Причем акцент на масштабируемость и унификацию делается неспроста. Дело в том, что данная система может расширяться до старших моделей путем простой замены контроллерных блоков и имеет возможность предоставлять как блочный (через Fibre Channel, FCoE, iSCSI, SAS и InfiniBand), так и файловый доступ к данным (NFS), причем без каких бы то ни было дополнительных устройств (файлеров). Хотя нужно отметить, что есть возможность сэкономить: если файловый доступ не требуется, можно приобрести версию, в заводской комплектации которой в контроллерном блоке будет отсутствовать плата, отвечающая за файловый доступ.
Читать полностью »
Российские операторы подсчитали, сколько стоит хранение звонков всех абонентов на протяжении 3 лет
2016-04-18 в 9:03, admin, рубрики: анб, вымпелком, дата-центры, Железо, запись трафика, информационная безопасность, Мегафон, МТС, сотовая связь, хранение данныхОператорам придётся строить инфраструктуру как у АНБ
Депутат Ирина Яровая. Фото: Рамиль Ситдиков / РИА Новости
Как известно, 7 апреля депутат Госдумы Ирина Яровая и член Совета Федерации Виктор Озеров предложили внести поправки в федеральное законодательство, в том числе одну поправку в закон «О связи», в п. 1 ст. 64: «Операторы связи обязаны хранить на территории Российской Федерации в течение трёх лет информацию о фактах приёма, передачи, доставки и (или) обработки голосовой информации и текстовых сообщений, включая их содержание, а также изображения, звуки или иные сообщения пользователей услугами связи».
Операторы связи огласили смету, в какую сумму им выльется хранение такого объёма данных. Выходит, что расходы на слежку за абонентами превысят годовую выручку операторов.
Читать полностью »
Ученым удалось успешно сохранить изображения в ДНК и считать их
2016-04-12 в 11:23, admin, рубрики: Биотехнологии, будущее здесь, днк, запись информации, Накопители, Научно-популярное, хранение данныхОбщий объем сохраненной информации — 151 КБ
В пробе ДНК в пипетке (розовый след) можно хранить около 9 ТБ данных
Сотрудники исследовательского подразделения Microsoft и команда ученых из Вашингтонского университета смогли успешно сохранить в ДНК ряд изображений, а затем считать эту информацию без ошибок. Всего в работе использовалось четыре графических файла, размер которых составлял от 5 до 24 КБ. Предварительные результаты своей работы специалисты опубликовали в ASPLOS.
Почему в качестве носителя информации выбрали ДНК? Дело в том, что запись данных здесь можно вести с очень высокой плотностью. По предварительным подсчетам, эксабайт данных может быть сохранен в объеме кубического миллиметра. Кроме того, ДНК — «долгожитель» в мире носителей информации. Срок хранения данных на таком носителе составляет 500 лет и больше. Правда, процесс считывания и записи технически сложен и дорог, но с течением времени и эти две проблемы могут быть решены.
Читать полностью »
Суть и преимущества программно-определяемых систем хранения
2016-04-12 в 7:27, admin, рубрики: Блог компании EMC², ит-инфраструктура, программно-определяемое хранилище, программно-определяемый, хранение данных, метки: программно-определяемое хранилище, программно-определяемый
В условиях быстрого роста объемов и разнообразия создаваемых типов данных, программно-определяемые системы хранения дают компаниям возможность эффективно адаптироваться к резким темпам роста. В последнее время само понятие программно-определяемой СХД активно продвигается на рынке, и в результате далеко не все хорошо понимают, что же на самом деле обозначает этот термин. Давайте подробнее рассмотрим, что за ним кроется.
Читать полностью »
Новый законопроект обязывает операторов связи хранить все данные абонентов в течение 3-х лет
2016-04-08 в 10:07, admin, рубрики: операторы связи, пользователи, регулирование интернета, роскомсвобода, хранение данныхРечь идет о голосовых данных, текстовых сообщения, изображениях, звуках или прочих типах сообщений интернет-пользователей и абонентов мобильной связи
7 апреля в Госдуму внесен законопроект со сложным названием «О внесении изменений в отдельные законодательные акты Российской Федерации в части установления дополнительных мер противодействия терроризму и обеспечения общественной безопасности». Авторами законопроекта являются два человека — депутат Яровая и сенатор Озеров, пишет «Роскомсвобода».
Сам документ вносит ряд значительных изменений в несколько законов. В частности, авторы документа предлагают добавить в закон «О связи» следующую формулировку пункта 1-го статьи 64: «Операторы связи обязаны хранить на территории Российской Федерации в течение трех лет информацию о фактах приема, передачи, доставки и (или) обработки голосовой информации и текстовых сообщений, включая их содержание, а также изображения, звуки или иные сообщения пользователей услугами связи...».
Читать полностью »
Data Lake – от теории к практике. Методы интеграции данных Hadoop и корпоративного DWH
2016-04-07 в 16:13, admin, рубрики: big data, dwh, gphdfs, greenplum, Hadoop, hdfs, Hive, informatica, informatica bde, sas, sql, Блог компании Тинькофф Банк, хранение данныхВ этой статье я хочу рассказать про важную задачу, о которой нужно думать и нужно уметь решать, если в аналитической платформе для работы с данными появляется такой важный компонент как Hadoop — задача интеграции данных Hadoop и данных корпоративного DWH. В Data Lake в Тинькофф Банке мы научились эффективно решать эту задачу и дальше в статье я расскажу, как мы это сделали.
Данная статья является продолжением цикла статей про Data Lake в Тинькофф Банке (предыдущая статья Data Lake – от теории к практике. Сказ про то, как мы строим ETL на Hadoop).
Новости MSA и StoreEasy
2016-04-05 в 13:08, admin, рубрики: HPE, MSA, StoreEasy, Блог компании Hewlett Packard Enterprise, ит-инфраструктура, хранение данныхНедавно мы анонсировали дополнения линейки систем хранения данных начального уровня. Новости можно отнести к двум категориям:
- Во-первых, MSA. Главная новость — MSA 1040 теперь поддерживает твердотельные накопители. Команда MSA приложила немало усилий, чтобы сделать систему доступной.
- Далее — пополнение портфеля StoreEasy новым интересным продуктом StoreEasy 1650 Expanded. Его можно «расширять» дополнительным набором накопителей до общей емкости 224 ТБ (в шасси высотой 2U).
Это вкратце. А теперь расскажу подробнее.
Читать полностью »