Как великий экспериментатор с самопальными "хранилками" хочу поделиться актуальной информацией.
Как я уже писал ранее, у меня на практике были достаточно серьезные проблемы с СХД, построенной на базе нового серьезного железа + Server 2012 + StarWind.
Проблема следующая:
Перезагружаем 2012 сервер на системе хранения и после загрузки и восстановления всех сервисов по идее, ESXi хосты должны обнаружить восставшие из мёртвых LUN-ы и продолжить работу застывших ВМ.
Но всё идёт не так
Примерно одна треть (из 30 датастор) вдруг начинают отображаться сереньким в списке даластор. То есть они не активны.
Смотрим на iSCSI сторадж-адаптеры на хостах и видим, что некоторые LUN тоже серенькие (их гораздо меньше, чем серых датастор, но они есть).
Теперь идем в датасторы и смотрим у каждой, а какие хосты её видят. И о ужас! Не все датасторы видятся хостами!
Некоторые хосты серенькие. А некоторых вообще нет! Тут все зависит от того, видят ли iSCSI сторадж адаптеры сами LUN.
Не видит совсем - хоста не будет в списке хостов у датасторы.
Видит сереньким или видит нормально - тогда хост там будет в списке, но 2 варианта, либо он серый, либо нормальный.
Реакции на ресканы и рефреши - никакой. Причем, что самое интересное, один и тот же LUN все хосты могут видеть по разному. Некоторые хосты могут вполне хорошо с ним работать А остальные хосты в упор не видеть.
Причем у хостов есть привязка к именам этих LUN. Если со стороны СХД изменить номер LUN с, например, 5 на 10, то все сторадж-адаптеры, которые видят LUN серым и потерянным, увидят, что у него сменился номер с 5 на 10 И продолжат отображать его серым под новым номером. Чудеса.
Пробуем добавить новый сторадж, и о чудо, вот они все датасторы, в списке не добавленных. Но добавить под старым именем датастору можно только на 1 хосте в кластере. Она добавится, но с остальных хостов видна не будет.
При попытке добавить её на другом хосте, ESXi предложит её отформатировать Естественно, все данные накроются.
Есть лишь 1 вариант правильно добавить датастору - со сменой её ID и + новым именем. Тогда она добавится на все хосты, которые нормально видят сам LUN (не серым).
А что делать с теми, кто криво видят LUN? Махинации со сторадж-адаптерами не приводят к успеху. Даже если удалить и добавить iSCSI программный инициатор (адаптер), хост все равно будет криво видеть LUN-ы.
Решается вопрос просто, ребутим хост. Да, машинки подвисшие с него придется пристрелить. И после загрузки счастье приходит, хост вдруг начинает корректно видеть все LUN.
Итак, если у вас вдруг перезагрузилась хранилка и хосты криво видят LUN и датасторы, до делаем следующее:
1. Перегружаем хосты.
2. Добавляем отвалившиеся датасторы под новыми именами.
3. Убиваем подвисшие ВМ на проблемных датасторах.
4. Удаляем из инвентори все ВМ с проблеммных датастор. Серенькие датасторы сами исчезнут как только все перестали ими пользоваться.
5. Переименовываем в нужное имя новые датасторы (данные сохранены)
6. Добавляем в инвентори те машинки, которые мы из инвентори удаляли.
Не претендую на истинно правильное решение, но так точно работает и данные точно не умрут.
Времени процедура занимает полдня При большом количестве ВМ (у меня было 150+)
P.S. Кто виноват - не знаю. Но грешу на сторону VMWare.