Ведомые виртуальные машины не работают в CloudLab
Две из трех моих подчиненных виртуальных машин не работают, и я не могу их сшить. Мы выполнили сложную перезагрузку, но они все еще не работают. Любая идея, как вернуть их или как отладить, чтобы найти причину. Вот что jps
:
3542 RunJar
9920 SecondaryNameNode
10094 ResourceManager
10244 NodeManager
8677 DataNode
31634 Jps
8536 NameNode
Вот еще одна деталь:
ubuntu@anmol-vm1-new:~$ sudo netstat -atnp | grep 8020
tcp 0 0 10.0.1.190:8020 0.0.0.0:* LISTEN 8536/java
tcp 0 0 10.0.1.190:50957 10.0.1.190:8020 ESTABLISHED 8677/java
tcp 0 0 10.0.1.190:8020 10.0.1.190:50957 ESTABLISHED 8536/java
tcp 0 0 10.0.1.190:8020 10.0.1.193:46627 ESTABLISHED 8536/java
tcp 0 0 10.0.1.190:44300 10.0.1.190:8020 TIME_WAIT -
tcp 0 0 10.0.1.190:8020 10.0.1.190:44328 ESTABLISHED 8536/java
tcp 0 0 10.0.1.190:8020 10.0.1.193:44610 ESTABLISHED 8536/java
tcp6 0 0 10.0.1.190:44292 10.0.1.190:8020 TIME_WAIT -
tcp6 0 0 10.0.1.190:44328 10.0.1.190:8020 ESTABLISHED 10244/java
tcp6 0 0 10.0.1.190:44252 10.0.1.190:8020 TIME_WAIT -
tcp6 0 0 10.0.1.190:44247 10.0.1.190:8020 TIME_WAIT -
tcp6 0 0 10.0.1.190:44287 10.0.1.190:8020 TIME_WAIT -
Когда я запускаю следующую команду:
hadoop fsck /
результат:
The filesystem under path '/' is CORRUPT
Вот более подробная информация в этой пастбине.
1 ответ
Решение
Если они не работают и если вы не можете ssh их, это означает, что ваша файловая система может быть переполнена. Вы должны войти в систему с помощью консоли VM и очистить файловую систему, ssh больше не будет работать.