Относительно концепции Hadoop Secondarynamenode

В соответствии с документацией (http://hadoop.apache.org/common/docs/r0.20.203.0/hdfs_user_guide.html) имя virtualnamenode устарело в выпуске hadoop0.20.203.0 и заменено контрольным узлом и резервным узлом. Но в кластере настроить doc (http://hadoop.apache.org/common/docs/r0.20.203.0/cluster_setup.html) нигде не упоминалось об этом изменении. Более того, bin/start-dfs.sh начальный узел вторичного имени по адресу, указанному в файле conf / masters.

Кто-нибудь может представить, в чем разница? Означает ли это, что конфигурация не изменилась? изменена только внутренняя архитектура

Также в выпуске hadoop0.23.0 нет файла conf / masters, в котором мы указывали адрес хоста, с которого должен запускаться вторичный узел имени.

Спасибо MRK

1 ответ

Также в выпуске hadoop0.23.0 нет файла conf/masters, в котором мы указывали адрес хоста, с которого должен запускаться вторичный узел имени.

Документация для 0.23 немного скудна, и мне пришлось копаться в коде. В DFSConfigKeys.java определены следующие переменные. Установить dfs.namenode.secondary.http-address ключ к ip:port в hdfs-site.xml и запустите вторичный namenode, используя sbin/hadoop-daemon.sh start secondarynamenode команда. Запустите команду jps, чтобы проверить, работает ли вторичный namenode, а также проверьте файл журнала на наличие ошибок.

public static final String DFS_NAMENODE_SECONDARY_HTTP_ADDRESS_KEY = "dfs.namenode.secondary.http-address";

Кто-нибудь может представить, в чем разница?

Вторичный NN называется CheckPoint NN. Но код все еще использует вторичный NN, и люди все еще называют его вторичным NN.

Из описания HDFS-2141 Jira, которое связано с выпуском 0.23

Active и Standby - это состояние NameNode. В то время как Backup и CheckPoint - это имя / роль запускаемых демонов.

Другие вопросы по тегам