Рубрика «Облачные вычисления» - 30

Яндекс, как и любая другая большая интернет-компания, хранит много, а точнее очень много данных. Это и пользовательские данные из разных сервисов, и намайненные сайты, и промежуточные данные для расчёта погоды, и резервные копии баз данных. Стоимость хранения ($/ГБ) — один из важных показателей системы. В этой статье я хочу рассказать вам про один из методов, который позволил нам серьезно удешевить хранилище.

Как применение кодов избыточности в SDS помогает Яндексу дёшево и надёжно хранить данные - 1

В 2015 году, как вы все помните, сильно вырос курс доллара. Точнее, расти-то он начал в конце 2014-го, но новые партии железа мы заказывали уже в 2015-м. Яндекс зарабатывает в рублях, и поэтому вместе с курсом выросла и стоимость железа для нас. Это заставило нас в очередной раз подумать о том, как сделать, чтобы в текущий кластер можно было положить больше данных. Мы такое, конечно, делаем регулярно, но в этот раз мотивация была особенно сильной. Кстати, если после поста у вас останутся вопросы, которые бы вы хотели обсудить лично, приходите на нашу встречу.

Каждый сервер кластера предоставляет для нас следующие ресурсы: процессор, оперативную память, жёсткие диски и сеть. Сеть здесь — более сложное понятие, чем просто сетевая плата. Это ещё и вся инфраструктура внутри дата-центра, и связность между разными дата-центрами и точками обмена трафиком. В кластере для обеспечения надёжности применялась репликация, и суммарный объём кластера определялся исключительно через суммарную ёмкость жёстких дисков. Нужно было придумать, как обменять оставшиеся ресурсы на увеличение места.

Читать полностью »

Видеозапись вебинара «Инструменты для работы Data Scientist» - 1

Вчера наша команда провела вебинар на тему «Инструменты для работы Data Scientist». В его рамках мы рассмотрели, кто такой data scientist и какими инструментами он пользуется. Поговорили о платформе FlyElephant и чем она может быть полезной для работы data scientist’а.
Читать полностью »

Прошлым летом мы рассказывали о тестовом запуске виртуальной инфраструктуры (IaaS) на базе платформы Hyper-V. За год эксплуатации мы набили много шишек, отладили работу сервиса и запустили облако Cloud-V в большое плавание. Сегодня мы подробно разберем базовые возможности панели управления, а в следующих постах расскажем, как развернуть и настроить Active Directory, Exchange и не только.
Работаем в облаке на базе Hyper-V, часть 1: знакомство с панелью управления - 1
Читать полностью »

Интернет-компании выбирают и тестируют оборудование для дата-центров не только по номинальным спецификациям, поступившим от производителя, но и с учётом реальных продакшен-задач, которые будут выполняться на этом оборудовании. Затем, когда дата-центр уже спроектирован, построен и запущен, проводятся учения — узлы отключают без ведома сервисов и смотрят, насколько они подготовлены к подобной ситуации. Дело в том, что при такой сложной инфраструктуре невозможно добиться полной отказоустойчивости. В каком-то смысле идеальный дата-центр — это тот, который можно отключить без ущерба для сервисов, например для поиска Яндекса.

Руководитель группы экспертизы runtime поиска Олег Фёдоров был в числе докладчиков на большой поисковой встрече Яндекса, которая прошла в начале августа. Он рассказал обо всех основных аспектах проектирования дата-центров под задачи, связанные с обработкой огромных объёмов данных. Под катом — расшифровка и слайды Олега.

Читать полностью »

Самый используемый гипервизор? Xen - 1 СТОП! Стоп-стоп-стоп. Понимаю ваше возмущение. Я знаю, что вы уже готовы кричать о том, что я некомпетентный идиот, если написал такое в заголовке. Заголовок, действительно, провокационный, но давайте разберемся.

Итак. О чем вы мне хотели сказать? Большинство из вас, вероятно, хотело мне сообщить, что VMware – доминирующая система виртуализации для предприятий. Возможно, кто-то, кто связан с компаниями, вся инфраструктура которых построена на решениях Microsoft, готов убеждать меня в том, что популярность Hyper-V сравнима, или даже в каких-то случаях превосходит VMware. И обязательно найдутся те, кто вспомнит, что в телекоме, хостинге и OpenStack-решениях, как правило, используют KVM.
Читать полностью »

MTC и IBM: облачные сервисы и современные приложения — это просто - 1
Александр Климов, ведущий инженер-программист, член Академии технологий компании IBM

Недавно в Клиентском центре IBM прошел двухдневный хакатон с целью привлечения разработчиков к поиску и разработке перспективных идей и их ознакомления с платформой для разработки облачных сервисов IBM Bluemix*.

Участникам было необходимо организоваться в команды, придумать идею, разработать проект и презентовать его жюри хакатона, которое состояло из представителей компаний-организаторов — МТС и IBM. Жюри голосованием определяло победителей, чьи идеи и проекты как с технической, так и с точки зрения бизнеса, оказались наиболее интересными и убедительными. Обладатели трех первых мест получили денежные призы и незабываемый опыт ночной отладки и презентации своих приложений после бессонной ночи.
Читать полностью »

Первый пост на хабре или Почему мы занимаемся облаками - 1

Приветствую! Наконец-то моя компания запустила блог на хабре! Ранее, сотрудники уже успели опубликовать несколько полезных статей:

» Настройка IPv6 в ОС Linux Debian v7.XX, Ubuntu v14.XX, CentOS v6.XX и FreeBSD v10.XX
» Интеграция Fail2ban с CSF для противодействия DDoS на nginx
» Контроль исправности сервера под управлением гипервизора VMware vSphere ESXi v5
» Несколько версий PHP в ISPmanager
» Безопасное шифрованное хранилище данных и особенности работы с ним

В своем первом, в корпоративном блоге компании, посте, я хотел бы поговорить об облачных технологиях как об услуге.

Облачные технологии сами по себе — это как двигатель внутреннего сгорания — он то изобретен, работает, везде применяется, но вот как и где применяется: на легковых машинах или грузовиках — и как он должен работать? Вот об этом я хотел бы поговорить, поэтому этот пост будет скорее всего посвящен вопросам, чем обстоятельным ответам, и моим соображения на этот счет. Читать полностью »

Cold Storage в облаке: Amazon, Google, Microsoft меняют рынок облачных сервисов хранения данных - 1

Поскольку объем данных, которыми оперируют различные компании растет, а эти данные нужно где-то хранить, крупнейшие провайдеры облачных сервисов стали предлагать своим клиентам «холодное хранение» данных. По всей видимости, cold storage сервисы могут занять какую-то часть рынка традиционных услуг хранения данных.

При этом cold storage в качестве облачного сервиса может в значительной степени изменить способ работы компаний с данными, включая хранение информации и ее доставку. Amazon Web Services, Google Cloud Platform, и теперь еще и Microsoft Azure предлагают клиентам cold storage сервис. При этом у каждого из названных сервисов свои особенности.
Читать полностью »

Vault header 

Задайте себе вопрос — как правильно хранить пароль от базы данных, которая используется вашим сервисом? В отдельном репозитории с секретами? В репозитории приложения? В системе деплоя (Jenkins, Teamcity, etc)? В системе управления конфигурациями? Только на личном компьютере? Только на серверах, на которых работает ваш сервис? В некоем хранилище секретов?
Зачем об этом думать? Чтобы минимизировать риски безопасности вашей инфраструктуры.
Начнём исследование вопроса с определения требований к хранению секретов.

Читать полностью »

Большинство сложных задач с данными требуют немалого количества ресурсов. Поэтому почти у каждого дата-центра в мире не один, а множество клиентов — даже если все они выступают под общим брендом. Компаниям нужны мощности под самые разные сервисы и цели, да и в процессе достижения какой-нибудь одной из них приходится иметь дело с целым набором подзадач. Как дата-центру справиться с потоком желающих что-нибудь проанализировать или посчитать? Поступающие заказы на вычисления нужно выполнять в некотором порядке, стараясь никого не обделить ресурсами. Эта лекция — об основных методах распределения реальных задач на большом кластере. Способ, о котором рассказал Игнат Колесниченко, применяется для обслуживания почти всех сервисов Яндекса.

Игнат — руководитель одной из групп в нашей службе технологий распределенных вычислений. Окончил мехмат МГУ и Школу анализа данных, в Яндексе с 2009 года.

Под катом — подробная расшифровка лекции и слайды.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js