Рубрика «Облачные вычисления» - 30

Как применение кодов избыточности в SDS помогает Яндексу дёшево и надёжно хранить данные

2016-10-05 в 15:12, admin, рубрики: mds, XOR, Блог компании Яндекс, дата-центры, коды Рида-Соломона, Облачные вычисления, реплики, хранение данных, хранилища данных, хранилище файлов

Яндекс, как и любая другая большая интернет-компания, хранит много, а точнее очень много данных. Это и пользовательские данные из разных сервисов, и намайненные сайты, и промежуточные данные для расчёта погоды, и резервные копии баз данных. Стоимость хранения ($/ГБ) — один из важных показателей системы. В этой статье я хочу рассказать вам про один из методов, который позволил нам серьезно удешевить хранилище.

В 2015 году, как вы все помните, сильно вырос курс доллара. Точнее, расти-то он начал в конце 2014-го, но новые партии железа мы заказывали уже в 2015-м. Яндекс зарабатывает в рублях, и поэтому вместе с курсом выросла и стоимость железа для нас. Это заставило нас в очередной раз подумать о том, как сделать, чтобы в текущий кластер можно было положить больше данных. Мы такое, конечно, делаем регулярно, но в этот раз мотивация была особенно сильной. Кстати, если после поста у вас останутся вопросы, которые бы вы хотели обсудить лично, приходите на нашу встречу.

Каждый сервер кластера предоставляет для нас следующие ресурсы: процессор, оперативную память, жёсткие диски и сеть. Сеть здесь — более сложное понятие, чем просто сетевая плата. Это ещё и вся инфраструктура внутри дата-центра, и связность между разными дата-центрами и точками обмена трафиком. В кластере для обеспечения надёжности применялась репликация, и суммарный объём кластера определялся исключительно через суммарную ёмкость жёстких дисков. Нужно было придумать, как обменять оставшиеся ресурсы на увеличение места.

Читать полностью »

Видеозапись вебинара «Инструменты для работы Data Scientist»

2016-09-29 в 10:24, admin, рубрики: algorithms, big data, data mining, data science, deep learning, FlyElephant, Hadoop, HPC, spark, Блог компании FlyElephant, вебинар, высокая производительность, машинное обучение, Облачные вычисления

Видеозапись вебинара «Инструменты для работы Data Scientist» - 1

Вчера наша команда провела вебинар на тему «Инструменты для работы Data Scientist». В его рамках мы рассмотрели, кто такой data scientist и какими инструментами он пользуется. Поговорили о платформе FlyElephant и чем она может быть полезной для работы data scientist’а.
Читать полностью »

Работаем в облаке на базе Hyper-V, часть 1: знакомство с панелью управления

2016-09-23 в 9:13, admin, рубрики: azure pack, cloud, cloud-v, dataline, hyper-v, Блог компании DataLine, виртуализация, даталайн, ит-инфраструктура, Облачные вычисления, облачные сервисы, хостинг

Прошлым летом мы рассказывали о тестовом запуске виртуальной инфраструктуры (IaaS) на базе платформы Hyper-V. За год эксплуатации мы набили много шишек, отладили работу сервиса и запустили облако Cloud-V в большое плавание. Сегодня мы подробно разберем базовые возможности панели управления, а в следующих постах расскажем, как развернуть и настроить Active Directory, Exchange и не только.
Работаем в облаке на базе Hyper-V, часть 1: знакомство с панелью управления - 1
Читать полностью »

Вызовы поискового облака. Лекция в Яндексе

2016-09-17 в 15:48, admin, рубрики: Блог компании Яндекс, дата-центры, инфраструктура, инфраструктурные решения, ит-инфраструктура, облака, Облачные вычисления, облачные технологии, облачный хостинг, поисковые технологии, Сетевые технологии, учения, хранилища данных, эксплуатация

Интернет-компании выбирают и тестируют оборудование для дата-центров не только по номинальным спецификациям, поступившим от производителя, но и с учётом реальных продакшен-задач, которые будут выполняться на этом оборудовании. Затем, когда дата-центр уже спроектирован, построен и запущен, проводятся учения — узлы отключают без ведома сервисов и смотрят, насколько они подготовлены к подобной ситуации. Дело в том, что при такой сложной инфраструктуре невозможно добиться полной отказоустойчивости. В каком-то смысле идеальный дата-центр — это тот, который можно отключить без ущерба для сервисов, например для поиска Яндекса.

Руководитель группы экспертизы runtime поиска Олег Фёдоров был в числе докладчиков на большой поисковой встрече Яндекса, которая прошла в начале августа. Он рассказал обо всех основных аспектах проектирования дата-центров под задачи, связанные с обработкой огромных объёмов данных. Под катом — расшифровка и слайды Олега.

Читать полностью »

Самый используемый гипервизор? Xen

2016-08-24 в 13:52, admin, рубрики: Amazon Web Services, cloud computing, xen, xenserver, виртуализация, ит-инфраструктура, Облачные вычисления, системное администрирование

Самый используемый гипервизор? Xen - 1 СТОП! Стоп-стоп-стоп. Понимаю ваше возмущение. Я знаю, что вы уже готовы кричать о том, что я некомпетентный идиот, если написал такое в заголовке. Заголовок, действительно, провокационный, но давайте разберемся.

Итак. О чем вы мне хотели сказать? Большинство из вас, вероятно, хотело мне сообщить, что VMware – доминирующая система виртуализации для предприятий. Возможно, кто-то, кто связан с компаниями, вся инфраструктура которых построена на решениях Microsoft, готов убеждать меня в том, что популярность Hyper-V сравнима, или даже в каких-то случаях превосходит VMware. И обязательно найдутся те, кто вспомнит, что в телекоме, хостинге и OpenStack-решениях, как правило, используют KVM.
Читать полностью »

MTC и IBM: облачные сервисы и современные приложения — это просто

2016-08-19 в 14:47, admin, рубрики: ibm Bluemix, Блог компании IBM, Облачные вычисления, облачные сервисы, Хакатоны

MTC и IBM: облачные сервисы и современные приложения — это просто - 1
Александр Климов, ведущий инженер-программист, член Академии технологий компании IBM

Недавно в Клиентском центре IBM прошел двухдневный хакатон с целью привлечения разработчиков к поиску и разработке перспективных идей и их ознакомления с платформой для разработки облачных сервисов IBM Bluemix*.

Участникам было необходимо организоваться в команды, придумать идею, разработать проект и презентовать его жюри хакатона, которое состояло из представителей компаний-организаторов — МТС и IBM. Жюри голосованием определяло победителей, чьи идеи и проекты как с технической, так и с точки зрения бизнеса, оказались наиболее интересными и убедительными. Обладатели трех первых мест получили денежные призы и незабываемый опыт ночной отладки и презентации своих приложений после бессонной ночи.
Читать полностью »

Первый пост на хабре или Почему мы занимаемся облаками

2016-08-16 в 10:19, admin, рубрики: Блог компании SIM-Networks, виртуализация, ит-инфраструктура, Облачные вычисления, облачные технологии, облачные технологии как сервис, первый пост на хабре, постановка проблем, развитие рынка облаков, хостинг, метки: первый пост на хабре

Приветствую! Наконец-то моя компания запустила блог на хабре! Ранее, сотрудники уже успели опубликовать несколько полезных статей:

» Настройка IPv6 в ОС Linux Debian v7.XX, Ubuntu v14.XX, CentOS v6.XX и FreeBSD v10.XX
» Интеграция Fail2ban с CSF для противодействия DDoS на nginx
» Контроль исправности сервера под управлением гипервизора VMware vSphere ESXi v5
» Несколько версий PHP в ISPmanager
» Безопасное шифрованное хранилище данных и особенности работы с ним

В своем первом, в корпоративном блоге компании, посте, я хотел бы поговорить об облачных технологиях как об услуге.

Облачные технологии сами по себе — это как двигатель внутреннего сгорания — он то изобретен, работает, везде применяется, но вот как и где применяется: на легковых машинах или грузовиках — и как он должен работать? Вот об этом я хотел бы поговорить, поэтому этот пост будет скорее всего посвящен вопросам, чем обстоятельным ответам, и моим соображения на этот счет. Читать полностью »

Cold Storage в облаке: Amazon, Google, Microsoft меняют рынок облачных сервисов хранения данных

2016-08-07 в 0:30, admin, рубрики: Amazon AWS Glacier, Google Nearline, Microsoft Cool Blob Storage, Блог компании King Servers — ВПС и Выделенные серверы, Анти-ДДос, Серверы хранения, ит-инфраструктура, Облачные вычисления, холодное хранение данных, хранение данных, хранение информации, хранилища данных, метки: Amazon AWS Glacier, Google Nearline, Microsoft Cool Blob Storage, холодное хранение данных

Cold Storage в облаке: Amazon, Google, Microsoft меняют рынок облачных сервисов хранения данных - 1

Поскольку объем данных, которыми оперируют различные компании растет, а эти данные нужно где-то хранить, крупнейшие провайдеры облачных сервисов стали предлагать своим клиентам «холодное хранение» данных. По всей видимости, cold storage сервисы могут занять какую-то часть рынка традиционных услуг хранения данных.

При этом cold storage в качестве облачного сервиса может в значительной степени изменить способ работы компаний с данными, включая хранение информации и ее доставку. Amazon Web Services, Google Cloud Platform, и теперь еще и Microsoft Azure предлагают клиентам cold storage сервис. При этом у каждого из названных сервисов свои особенности.
Читать полностью »

Как не хранить секреты где придётся, или зачем нам Hashicorp Vault

2016-08-02 в 5:49, admin, рубрики: devops, hashicorp, secret management, security, Vault, ит-инфраструктура, Облачные вычисления, системное администрирование

Vault header

Задайте себе вопрос — как правильно хранить пароль от базы данных, которая используется вашим сервисом? В отдельном репозитории с секретами? В репозитории приложения? В системе деплоя (Jenkins, Teamcity, etc)? В системе управления конфигурациями? Только на личном компьютере? Только на серверах, на которых работает ваш сервис? В некоем хранилище секретов?
Зачем об этом думать? Чтобы минимизировать риски безопасности вашей инфраструктуры.
Начнём исследование вопроса с определения требований к хранению секретов.

Читать полностью »

Распределение ресурсов в больших кластерах высокой производительности. Лекция в Яндексе

2016-07-30 в 15:33, admin, рубрики: Блог компании Яндекс, деревья принятия решений, ит-инфраструктура, кластеры, Облачные вычисления, распределение ресурсов, распределённые вычисления, Серверная оптимизация, системное администрирование, стратегии

Большинство сложных задач с данными требуют немалого количества ресурсов. Поэтому почти у каждого дата-центра в мире не один, а множество клиентов — даже если все они выступают под общим брендом. Компаниям нужны мощности под самые разные сервисы и цели, да и в процессе достижения какой-нибудь одной из них приходится иметь дело с целым набором подзадач. Как дата-центру справиться с потоком желающих что-нибудь проанализировать или посчитать? Поступающие заказы на вычисления нужно выполнять в некотором порядке, стараясь никого не обделить ресурсами. Эта лекция — об основных методах распределения реальных задач на большом кластере. Способ, о котором рассказал Игнат Колесниченко, применяется для обслуживания почти всех сервисов Яндекса.

Игнат — руководитель одной из групп в нашей службе технологий распределенных вычислений. Окончил мехмат МГУ и Школу анализа данных, в Яндексе с 2009 года.

Под катом — подробная расшифровка лекции и слайды.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «Облачные вычисления» - 30

Как применение кодов избыточности в SDS помогает Яндексу дёшево и надёжно хранить данные

Видеозапись вебинара «Инструменты для работы Data Scientist»

Работаем в облаке на базе Hyper-V, часть 1: знакомство с панелью управления

Вызовы поискового облака. Лекция в Яндексе

Самый используемый гипервизор? Xen

MTC и IBM: облачные сервисы и современные приложения — это просто

Первый пост на хабре или Почему мы занимаемся облаками

Cold Storage в облаке: Amazon, Google, Microsoft меняют рынок облачных сервисов хранения данных

Как не хранить секреты где придётся, или зачем нам Hashicorp Vault

Распределение ресурсов в больших кластерах высокой производительности. Лекция в Яндексе

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «Облачные вычисления» - 30

Новости

Актуальные темы

Архив