Авария кластерного транспорта
Если кластерный транспорт (gfs2), показывает ошибку. Или при просмотре расширенных сведений видно что какие-то сервера не передают данные.
Требуется произвести перезагрузку сервисов (watchdog, corosync, dlm) переподключить сервера в разделе Хранилища Luns
Для разблокировки GFS2 необходимо перезапустить сервис GFS2
На всех серверах, производим следующие действия (начиная с сервера контроллер + нода)
Перезагружаем сервисы командой в CLI:
Важно
В таком порядке watchdog, corosync, dlm
Вывод lsblk и services list на всех 3ех серверах
Заходим в shell, на любой сервер, и применяем команду:
Убейте процесс /user/sbin/dlm_controld --foreground
Идем в var/run/dlm_controld
проверяем есть ли там файлы, если есть (на всякий случай копируем в другое место), удаляем
Повторно перезапускаем dlm
Примечание
Сервис dlm отвечает за монтирование Lun, и отслеживания состояния подключения watchdog, мог принять множественные перезагрузки сервиса, как неисправность сервера и отправить сервер в ребут
Теперь в CLI вбиваем storage gfs2, на всех серверах.
Частный случай, могут быть другие варианты