Диагностика при потере связи контроллера с узлами
-
Проверить, пингуется ли узел с контроллера по адресу интерфейса управления.
-
Если узел пингуется, зайти c контроллера через
node ssh [management_ip]
и проверить статус сервиса супервизора узла черезservices list
. -
Если сервис супервизора узла активен, посмотреть его журналы через
log node
. Супервизор циклически проверяет статус связи с контроллером и логирует о неудачных попытках. Если узел не может подключиться к контроллеру, хотя пингует его, возможно, стоит рестартовать супервизор контроллера черезservices restart controller-engine
. -
Удостоверьтесь через
node config
, что поля node_id, controller_ip, controller_id актуальные. -
Если сервис супервизора узла неактивен, запустить его через
services start node-engine
. -
Если узел не пингуется, то можно через Web-интерфейс контроллера проверить статус электропитания узла через IPMI. При необходимости включить или перезагрузить.
-
Если узел не пингуется, то через IPMI сервера проверить состояние линка физического интерфейса, используемого для управления. Интерфейс можно посмотреть через
net show ports -v
, у нужного интерфейса будет строка used by: veil-default. Если он в DOWN, то поднять его черезnet conf ports set-up -i [имя интерфейса]
.