Рубрика «высокая производительность» - 143

Google Photon. Обработка данных со скоростью света*

2013-12-26 в 22:00, admin, рубрики: big data, BigData, Google, photon, Realtime, высокая производительность, метки: BigData, Google, photon, Realtime

Photon – масштабируемая, отказоустойчивая и географически распределенная система обработки потоковых данных в режиме реального времени. Система является внутренним продуктом Google и используется в Google Advertising System. Research paper [5], описывающие базовые принципы и архитектуру Photon, был представлен на научной конференции ACM SIGMOD в 2013 году.

В paper [5] заявлено, что пиковая нагрузка на систему может составлять миллионы событий в минуту со средней end-to-end задержкой менее 10 секунд.
* 'Скорость света' в заголовке — ~~наглая ложь~~ гипербола.

Google Photon. Обработка данных со скоростью света*
Читать полностью »

В 2014 году сегмент микросерверов вырастет на 139%

2013-12-26 в 12:13, admin, рубрики: Блог компании King Servers, высокая производительность, микросервер, оборудование, серверное оборудование, Сетевые технологии, метки: микросервер, оборудование, серверное оборудование

В 2014 году сегмент микросерверов вырастет на 139%

Микросерверы — перспективный сегмент недорогих и энергоэкономичных компактных серверов. Именно они скоро будут востребованы на производствах, где не нужды в больших вычислительных мощностях. Также их собираются использоваться в дата-центрах новой архитектуры: миниатюрные микросервера планируется объединять в плотные кластеры. Если верить аналитикам из IC Insights, в ближайшем будущем именно представители этого сегмента будут «рулить» на рынках серверов во всем мире.

Читать полностью »

Бенчмарк HTTP-серверов (С/C++) в FreeBSD

2013-12-26 в 9:02, admin, рубрики: c++, c++ библиотеки, freebsd, высокая производительность, Сетевые технологии, метки: benchmark, c++ библиотеки, freebsd, http server

Бенчмарк HTTP серверов (С/C++) в FreeBSD

Проведено сравнение производительности ядер HTTP-серверов, построенных с использованием семи C/C++ библиотек, а также (в познавательных целях) — других готовых решений в этой области (nginx и node.js).

HTTP-сервер — это сложный и интересный механизм. Есть мнение, что плох программист, не написавший свой компилятор, я бы заменил «компилятор» на «HTTP-сервер»: это и парсер, и работа с сетью, и асинхронность с многопоточностью и много чего еще....

Тесты по всем возможным параметрам (отдача статики, динамики, всевозможные модули шифрования, прокси и т.п.) — задача не одного месяца кропотливой работы, поэтому задача упрощена: будем сравнивать производительность ядер. Ядро HTTP-сервера (как и любого сетевого приложения) — это диспетчер событий сокетов и некий первичный механизм их обработки (реализованный в виде пула потоков, процессов и т.п.). Сюда же можно отнести парсер HTTP-пакетов и генератор ответов. На первый взгляд, все должно свестись к тестированию возможностей того или иного системного механизма обработки асинхронных событий (select, epoll и т.п.), их мета-обёрток (libev, boost.asio и др.) и ядра ОС, однако конкретная реализация в виде готового решения дает существенную разницу в производительности.

Был реализован свой вариант HTTP-сервера на libev. Конечно, реализована поддержка небольшого подмножества требований пресловутого rfc2616 (вряд ли ее полностью реализует хоть один HTTP-сервер), лишь необходимый минимум для соответствия требованиям, предъявляемым к участникам данного тестирования,
Читать полностью »

Dremel. Как Google считает в real-time?

2013-12-25 в 20:46, admin, рубрики: big data, BigData, Google, Realtime, высокая производительность, метки: BigData, Google, Realtime

Dremel – масштабируемая система обработки запросов в режиме близком к режиму реального времени (near-real-time), предназначенная для анализа неизменяемых данных [4].

Авторы research paper [4] (среди которых, судя по всему, и наши соотечественники — Сергей Мельник и Андрей Губарев), в котором описываются базовые принципы и архитектура Dremel, заявляют, что система в силах:

выполнять агрегирующие запросы над боле чем над триллионом строк за секунды;
масштабируется на тысячи CPU;
предназначена для работы с петабайтами данных;
имеет тысячи пользователей внутри Google (дословно «at Google» [4]).

Dremel. Как Google считает в real time?
Читать полностью »

Spanner. NewSQL хранилище от Google

2013-12-24 в 20:43, admin, рубрики: big data, Google, NewSQL, Spanner, высокая производительность, метки: big data, Google, NewSQL, Spanner

Spanner – географически распределенная высокомасштабируемая мультиверсионная база данных с поддержкой распределенных транзакций. Хранилище было разработана инженерами Google для внутренних сервисов корпорации. Research paper [8], описывающий базовые принципы и архитектуру Spanner, был представлен на научной конференции 10th USENIX Symposium on Operating Systems Design and Implementation в 2012 году.

Spanner является эволюционным развитием NoSQL-предшественника – Google Bigtable. Сам же c Spanner относят к семейству NewSQL-решений. В research paper [8] заявляется, что дизайн Spanner позволяет системе масштабироваться на миллионы вычислительных узлов через сотни дата-центров и работать с триллионами строк данных.

Spanner. NewSQL хранилище от Google
Читать полностью »

Colossus. Распределенная файловая система от Google

2013-12-23 в 20:45, admin, рубрики: big data, Colossus, Google, высокая производительность, метки: big data, Colossus, Google

Colossus (или GFS2) – это проприетарная распределенная файловая система от Google, запущенная на production-серверах в 2009 году. Colossus является эволюционным развитием GFS. Как и ее предшественник GFS, Colossus оптимизирована для работы с большими наборами данных, прекрасно масштабируется, является высокодоступной и отказоустойчивой системой, а также позволяет надежно хранить данные.

В то же время, Colossus решает часть задач, с которыми GFS не справлялась, и устраняет некоторые узкие места предшественника.
Colossus. Распределенная файловая система от Google
Читать полностью »

Google Platform. 10+ лет

2013-12-22 в 20:22, admin, рубрики: big data, Google, высокая производительность, метки: big data, Google

Хранение и обработка данных – задача, которую человечество с переменным успехом решает ни одну тысячу лет. Проблемы, связанные с решением этой задачи, связаны не только с физическим объемом данных (volume), но и со скоростью изменчивости этих данных (velocity) и многообразием (variety) источников данных – то, что аналитики Gartner в своих статьях [11, 12] обозначили как «3V».

Computer Science не так давно столкнулась с проблемой Больших Данных, решения которой от ИТ ждут частные компании, правительства, научное сообщество.

И в мире уже появилась компания, которая, с переменным успехом, справляется с проблемой Big Data вот уже 10 лет. По моему ощущению (т.к. чтобы заявить достоверно нужны открытые данные, которых в свободном доступе нет) ни одна коммерческая или некоммерческая организация не оперирует большим объемом данных, чем компания, о которой идет речь.

Именно эта компания являлась основным контрибьютором идей платформы Hadoop, а также многих компонентов экосистемы Hadoop, таких как HBase, Apache Giraph, Apache Drill.

Как Вы догадались, речь идет о Google.
Google Platform. 10+ лет

Читать полностью »

Инструментарий суперкомпьютера IBM Watson стал доступным для разработчиков в виде «облака»

2013-12-20 в 18:55, admin, рубрики: IBM, watson, Блог компании IBM, высокая производительность, Облачные вычисления, суперкомпьютер, метки: IBM, watson, суперкомпьютер

Инструментарий суперкомпьютера IBM Watson стал доступным для разработчиков в виде «облака»

Суперкомпьютер Watson, созданный стараниями специалистов корпорации IBM, уже не раз «светился» на Хабре. Собственно, в этом нет ничего удивительного, поскольку подобные системы способны выполнять сложнейшие задачи, которые ставятся перед суперкомпьютерами учеными, медиками, военными. Однако, системы такого класса являются практически закрытыми, поскольку доступ к ним ограничен весьма узким кругом лиц.

Читать полностью »

Повышаем производительность смартфона. Все «за и против»

2013-12-20 в 18:27, admin, рубрики: высокая производительность, прошивка, смартфон, метки: прошивка, смартфон

Быстро разряжается, часто виснет, не хватает нужных функций… Кто из вас не сталкивался с этими «историями»?
Вот и у меня возник момент «х», когда я решился на процедуру, доселе мне не известную. Прошивка. Казалось бы, что может быть сложного? Скачиваем прошивку, скачиваем утилиту, подключаем телефон и прошиваем!
Вы в сказки верите? Я нет. И поэтому, начав эту процедуру, я был готов к «сказочным» приключениям.
Наломав кучу палок, дров, залежей угля и иных деревянных ресурсов, я таки прошил телефон, да не просто прошил, а с не оригинальным ядром! И до сих пор, спустя 3 месяца в восторге! Почему я раньше этого не сделал?
В двух словах — телефон просто «ожил»!
Дальше — что же я получил на выходе? Внимание, много «букав».Читать полностью »

AWS объявила о новых инстансах. Теперь до 32 ядер, 244ГБ RAM, 8×800 ГБ SSD

2013-12-20 в 13:45, admin, рубрики: Amazon Web Services, AWS, cassandra, mongodb, nosql, высокая нагрузка, высокая производительность, метки: aws, cassandra, mongodb, nosql, высокая нагрузка, высокая производительность

Только что получил анонс, что на AWS стали доступны новое поколение Amazon EC2 High I/O инстансов. Данные типы инстансов базируются на новом поколении процессоров Intel Ivy Bridge. Каждый виртуальный CPU (vCPU) соответствует одному аппаратную потоку исполнения (hyperthread) процессора Intel Xeon E5-2670 v2 (Ivy Bridge).

Вот табличка:
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «высокая производительность» - 143

Google Photon. Обработка данных со скоростью света*

В 2014 году сегмент микросерверов вырастет на 139%

Бенчмарк HTTP-серверов (С/C++) в FreeBSD

Dremel. Как Google считает в real-time?

Spanner. NewSQL хранилище от Google

Colossus. Распределенная файловая система от Google

Google Platform. 10+ лет

Инструментарий суперкомпьютера IBM Watson стал доступным для разработчиков в виде «облака»

Повышаем производительность смартфона. Все «за и против»

AWS объявила о новых инстансах. Теперь до 32 ядер, 244ГБ RAM, 8×800 ГБ SSD

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «высокая производительность» - 143

Новости

Актуальные темы

Архив