Консультация сбоя жестких дисков для модульного сервера Intel®
Жесткие диски являются все еще самым вероятным отказом в компьютере, из-за постоянно движущихся головок диска и дисков. Сбои жестких дисков являются частой причиной для потери данных. Установка массива RAID предоставляет определенное количество защиты (RAID 1, RAID 10, RAID 5 или RAID 6). Однако установка массива RAID не заменяет обычное резервное копирование данных бизнес-данных или персональных данных.
Модульный сервер Intel® имеет сложную структуру хранения. Доступные физические диски используются для создания пулов хранения данных, в которых создаются или больше виртуальных дисков, которые присвоены различным серверам в системе.
Поэтому сбой диска в пуле хранения данных, содержащем больше чем один виртуальный диск, может влиять на все виртуальные диски в этом пуле.
Владельцы или администраторы модульного сервера Intel® могут сделать определенные шаги для подготовки к отказам жесткого диска в этой системе.
- Купите один или два дополнительных жестких диска во время закупок модульного сервера Intel. если диск в производственной системе сбои, диски, купленные в то же время:
- Вероятно, иметь то же встроенное ПО диска
- Был бы под рукой сразу
Сконфигурируйте один диск как общее или специализированное горячее резервирование.
Сконфигурируйте электронные предупреждения для получения предупреждений условий Прогнозирующего предупреждения отказа (PFA) или сбоев диска.
PFA отправляется встроенным ПО диска в Intel® Storage Controller Module (SCM) в случае, если встроенное ПО диска находит любые реальные или принятые проблемы на диске.
Условие PFA обычно приводит к непосредственной Прогнозирующей миграции томов (PDM), если сконфигурировано горячее резервирование.
Условие PFA является прогнозирующим, таким образом, затронутый диск может продолжить работать, даже если PDM имел место. Для замены такого диска это должно быть вызвано оффлайн вручную, прежде, чем удалить его из корпуса. Эти действия гарантируют , что данные, ранее перемещенные на горячее резервирование, перейдутся назад к новому диску после того, как оно будет вставлено в этот разъем. Это действие получено в конечном счете журнал как переход.
PDMs и переходы назад к новому диску работают как фоновые действия. В зависимости от загрузки сервера в течение нормального рабочего дня это может оказать некоторое влияние на производительность или продолжительность миграции/перехода.
Любая миграция может оставить жесткий диск в устаревшем условии. Диск может стать устаревшим после того, как его данные стали устаревшими. Это может произойти, когда диск выведен из эксплуатации пользователем (использующий Силу Оффлайновое действие), физически демонтировав диск, или ошибкой диска или PDM. Когда пул хранения данных восстановлен для исправления для недостающего диска, диск отмечен как устаревший. Для предоставления доступа к физическому диску доступным после того, как это стало устаревшим пользователи должны выбрать диск в GUI модульного сервера и использовать Ясное Устаревшее действие Условия для возвращения диска онлайн. (Не принимайте эти меры , если диск был отмечен устаревший из-за отказа диска.)
Реальный внезапный сбой диска будет получен в конечном счете журнал постоянным сбросом диска и тайм-аутами команды к этому диску. Сбой диска инициировал электронное предупреждение , если устанавливается предупреждение. Такой отказ мог оставить пул хранения данных в критическом состоянии, пока диск не восстановлен, и влияйте на доступ вычислительных модулей к этому пулу хранения данных. Если горячее резервирование будет сконфигурировано, то данные от этого диска мигрируют на горячее резервирование и переход назад, когда будет заменен неисправный диск. Если никакое горячее резервирование не сконфигурировано, это может оставить пул хранения данных, виртуальные диски и вычислительные модули уязвимыми для второго сбоя диска. Эта уязвимость зависит от сконфигурированного уровня RAID. В такой ситуации замените жёсткий диск как можно скорее. Таким образом восстанавливание может запустить и сохранить влияние на вычислительные модули и их эксплуатацию максимально краткими.
Возможно, что больше чем один диск может перестать работать или около того же времени или друг вскоре после друга. Только одно фоновое действие может работать за один раз. Поэтому замените самый уязвимый физический диск сначала (один диск в массиве RAID 5, например) для управления этим, восстанавливание этого массива запускается сначала. После того, как миграция этого диска завершилась, замените второй диск.
Существует функция Справки, доступная в GUI модульного сервера Intel®. Проверьте Справку на любое действие, предлагающееся для любого на компонентах модульного сервера Intel® для установления то, что это делает и когда использовать его.
Если владельцы или администраторы модульного сервера Intel® встречаются, любой другой сбой диска связал условия, не объясненные в Справке GUI или этом документе, связывающиеся с поддержой клиента Intel в Вашей области для помощи.
