Перейти к содержанию

Диагностика при потере связи контроллера с узлами

  • Проверить, пингуется ли узел с контроллера по адресу интерфейса управления.

  • Если узел пингуется, зайти c контроллера через node ssh [management_ip] и проверить статус сервиса супервизора узла через services list.

  • Если сервис супервизора узла активен, посмотреть его журналы через log node. Супервизор циклически проверяет статус связи с контроллером и логирует о неудачных попытках. Если узел не может подключиться к контроллеру, хотя пингует его, возможно, стоит рестартовать супервизор контроллера через services restart controller-engine.

  • Удостоверьтесь через node config, что поля node_id, controller_ip, controller_id актуальные.

  • Если сервис супервизора узла неактивен, запустить его через services start node-engine.

  • Если узел не пингуется, то можно через Web-интерфейс контроллера проверить статус электропитания узла через IPMI. При необходимости включить или перезагрузить.

  • Если узел не пингуется, то через IPMI сервера проверить состояние линка физического интерфейса, используемого для управления. Интерфейс можно посмотреть через net show ports -v, у нужного интерфейса будет строка used by: veil-default. Если он в DOWN, то поднять его через net conf ports set-up -i [имя интерфейса].