В общем продолжаем тему.
Решил пересмотреть немного схему фермы. Раньше планировалось следующее подключение: 2 сервера через FC подключены к СХД непосредственно (direct). То есть как вы поняли все оборудование находится в одном помещении.
Теперь же идея появилась разнести два узла кластера HA по разным помещениям/зданиям и задействовать FC SAN. Таким образом поменялась схема соединений с ИБП. К сожалению первую схему для личного осознания что и как работает не получилось реализовать. Имеющийся для тестов UPS 1500 не тянет два сервер, вернее в момент пропадания входного напряжения реактивная нагрузка на аккумуляторы (сорри если не правильно выразился, не знаю как по правильному будет звучать) настолько сильная, что переход с байпаса на батареи не плавная и сервера выключаются тут же. Поэтому пока тестирую просто решение выключения одного хоста от NMC AP9630 через vPCNS v3.1.
Сразу хочу оговориться, что вполне многие из Вас это все знают уже и ничего нового не открыл. Пишу просто для тех кто ищет как я и столкнулся с этой задачей впервые.
Начну пока с настроек самой AP9630. Цель напомню максимально продержаться на ИБП и корректно завершить работу сервера.
Собственно тут нас интересуют следующие параметры:
Low Battery Duration - Время которое сможет держать ИБП при существующей нагрузке. То есть пример, есть ИБП, который может держать существующую нагрузку допустим 20 минут (параметр Runtime Remaining на вкладке Status). Так вот, если мы выставим параметр Low Battery Durationравным 5 минут, то после 15 минут работы от аккумуляторов (Runtime Remaining (20) - Low Battery Duration (5) = 15 минут) ИБП сформирует сигнал Low battery и начнется самое главное.
Если больше ничего не настроено дополнительно, то после истечения этого времени ИБП выключится.
Shutdown Delay - Время задержки выключения сервера. Как пояснила ТП APC этот параметр по идеи должен прибавить к Low Battery Durationдополнительное время для корректного выключения сервера. То есть 15 минут+5 минут + Shutdown Delay. Однако тестирование на простом сервер с Win2008R2 показало, что это параметр отвечает за другое, а именно после начала Low Battery Durationожидается отрезок времени Shutdown Delayи только потом начинается выключение сервера. Случай из тестирования. Время Low Battery Durationпоставил 2 минуты + Shutdown Delay 90 сек. Думал что уж 2м + 90сек хватит на корректное время завершение сервера. Но как оказалось данный параметр отвечает за другое и получилось, что после начала события Low Battery Duration отчиталось еще время Shutdown Delay и только потом началось выключение сервера. И как вы уже поняли оставшегося времени 2 минуты - 90 сек = 30 сек не хватило для выключения сервера корректно. Итог. Этот параметр лучше оставить равным 0 и увеличить параметр Low Battery Durationдо 5 минут. Это времени как правило хватает для завершения работы хоста/сервера, но все индивидуально и для разных ситуаций может быть времени и не хватить... Как пример слишком большое кол-во ВМ которые надо выключить.
Maximum Required Delay - это сумма всех задержек, просто информационное значение в моем случае это сумма значений Low Battery Duration (5) + 2 мин. прилетело с vPCNS
Также в настройках карты есть дополнительная секция настроек раннего выключения Controlled Early Shutdown (Суть вообще этой секции это безапелляционное выключение ИБП).В моем случае она пригодилась.
В каком случае эти настройки могут пригодиться. Во время тестирования другого сервера выяснилось, что основным потребителем питания от ИБП является сам сервер, и после корректного выключения этого сервера ИБП, который буквально пару секунд назад показывал время жизни при нагрузке равным 3-5 минут, то после того как сервер выключился это время уже показывается в моем случае 48-50 минут. То есть основная нагрузка исчезла и оставшихся потребителей (свитчи. роутеры) можно подпитывать еще очень долго. Однако данное поведение ИБП нас не устраивает, догадались почему???
Дело в том, что если подадут/возобновят питание, то ИБП не выключится/не перезагрузит свои выходные порты и как итог сервер останется в выключенном состоянии. А хотелось бы, что бы он включался после возобновления питания... Так вот в моем случае мне помогает параметр time on battery lasts longer than 10 min.Как работает это настройка. Случился у нас Low Battery Durationи начался отчет 5 минут, после того как сервер выключился корректно ИБП ожил и говорит, что он еще допустим 50 минут будет держать, вот тут параметр ime on battery lasts longer thanи видит, что 50 минут это больше его настроек = 10 минут. Если больше, то значит надо все выполнить ранее выключение и как только истекает значение Low Battery Duration (5 минут), то ИБП принудительно выключается.
К сожалению я тут ввел Вас в заблуждение. Данный параметр отрабатывает по другому. А именно, как только отрубили питание, ИБП видит, что продержится допустим еще 20 минут. Вот тут как раз и вступает в игру этот параметр Controlled Early Shutdown (time on battery lasts longer than 10 min),он видит, что ИБП продержится больше чем установлено у него 10 минут и начинает выключение ИБП немедленно, что нас вообще никак не устраивает. Решением из данной ситуации, как выяснилось позже стало установка параметра
Minimum Battery Capacity: Емкость которую ИБП накопит прежде чем включиться после возобновления питания.
Return Delay: Время задержки включения ИБП. Суммируется с Minimum Battery Capacity. То есть подали напряжение, ИБП зарядился до 30 % подождал еще 120 сек и только после этого включился.
Данные параметры необходимы для того, чтобы если повторно выключиться напряжение сервера успели опять корректно выключиться.
On-Battery Shutdown Behavior: Поведение ИБП. В нашем случае нужно выставить чекбокс Restart when power is restored. То есть перезагрузить выходные порты ИБП после подачи напряжения (вернее после Minimum Battery Capacity+Return Delay ), для того, чтобы биос сервера отработал и запустил сервера.
Собственно на этом основные настройки карты сделаны. Далее опишу как настроил vPCNS и привязал к NMC...