Относительно концепции Hadoop Secondarynamenode
В соответствии с документацией (http://hadoop.apache.org/common/docs/r0.20.203.0/hdfs_user_guide.html) имя virtualnamenode устарело в выпуске hadoop0.20.203.0 и заменено контрольным узлом и резервным узлом. Но в кластере настроить doc (http://hadoop.apache.org/common/docs/r0.20.203.0/cluster_setup.html) нигде не упоминалось об этом изменении. Более того, bin/start-dfs.sh начальный узел вторичного имени по адресу, указанному в файле conf / masters.
Кто-нибудь может представить, в чем разница? Означает ли это, что конфигурация не изменилась? изменена только внутренняя архитектура
Также в выпуске hadoop0.23.0 нет файла conf / masters, в котором мы указывали адрес хоста, с которого должен запускаться вторичный узел имени.
Спасибо MRK
1 ответ
Также в выпуске hadoop0.23.0 нет файла conf/masters, в котором мы указывали адрес хоста, с которого должен запускаться вторичный узел имени.
Документация для 0.23 немного скудна, и мне пришлось копаться в коде. В DFSConfigKeys.java определены следующие переменные. Установить dfs.namenode.secondary.http-address
ключ к ip:port в hdfs-site.xml и запустите вторичный namenode, используя sbin/hadoop-daemon.sh start secondarynamenode
команда. Запустите команду jps, чтобы проверить, работает ли вторичный namenode, а также проверьте файл журнала на наличие ошибок.
public static final String DFS_NAMENODE_SECONDARY_HTTP_ADDRESS_KEY = "dfs.namenode.secondary.http-address";
Кто-нибудь может представить, в чем разница?
Вторичный NN называется CheckPoint NN. Но код все еще использует вторичный NN, и люди все еще называют его вторичным NN.
Из описания HDFS-2141 Jira, которое связано с выпуском 0.23
Active и Standby - это состояние NameNode. В то время как Backup и CheckPoint - это имя / роль запускаемых демонов.