Это история из серии «Записки сервисного инженера». На вопрос ответим чуть позже, а сначала небольшой сказ об одном МАССИВном падении. Недавно в наш Сервисный центр обратился клиент, который решил самостоятельно проапгрейдить массив HDS AMS2000: заменить часть старых дисков на новые большего размера. Со слов заказчика, он вставил новый диск – и один контроллер сломался; вытащил новый диск – и второй контроллер тоже включил аварийную индикацию, а со всех систем пропал доступ к массиву.
Задаем администратору вопросы по его действиям. Выясняется, что именно этот администратор заступил на свою смену уже после того, как решили вытащить новый диск. В итоге массив не включался. Согласно логам с контролеров, контроллеры не могли раскрутить диски, а на дисках отсутствовала какая-либо индикация.
Что же тут могло случиться? Собрали «консилиум» наших сервисных инженеров, стали думать. Первая версия: может быть, при установке диска что-то произошло с дисковым бекплейном и он стал нерабочим? Решили найти шасси массива без контроллеров, чтобы заменить шасси целиком вместе с бекплейном. Не найдя его, попросили заказчика переусадить все диски в шасси с контроллером и попробовать завести массив.
И вот тут-то нас ждал что называется «удар – и катарсис» (и та самая «банановая шкурка», которая уронила всю систему). Выяснилось, что в шасси с котроллером клиент вытащил аккурат первые пять дисков (если вы понимаете, о чем я)! Именно их размер он и хотел увеличить. Все то время, пока предпринимались попытки реанимировать массив, диски были извлечены. Вернули прежние диски на место. И, о чудо, массив включился!
Мораль сей басни проста: только курица может бегать без головы, да и то недолго. В HDS Mid-Range на первых пяти дисках хранится копия конфигурации массива. При загрузке массив сначала пытается раскрутить первые 5 дисков в шасси с контроллером. В случае неудачи (например, из-за отсутствия оных), загрузка останавливается.
Николай Ведяшкин, эксперт Сервисного центра компании «Инфосистемы Джет».
Автор: Инфосистемы Джет