Функция объединителя в Apache Hadoop с Gora
У меня есть простой Hadoop, Nutch 2.x, кластер Hbase. Я должен написать работу MR, которая найдет некоторую статистику. Это двухступенчатая работа, т. Е. Я думаю, что мне также нужна функция объединителя. В простых заданиях Hadoop это не большая проблема, так как приводится много руководств, например, это. Но я не смог найти ни одного варианта использования комбайнера с Гора. Моя статистика будет добавлена на страницы в Hbase, поэтому я не мог о Горе (я думаю). Ниже приведен фрагмент кода, где я ожидаю добавить ком
GoraMapper.initMapperJob(job, query, pageStore, Text.class, WebPage.class,
My_Mapper.class, null, true);
job.setNumReduceTasks(1);
// === Reduce ===
DataStore<String, WebPage> hostStore = StorageUtils.createWebStore(
job.getConfiguration(), String.class, WebPage.class);
GoraReducer.initReducerJob(job, hostStore, My_Reducer.class);
1 ответ
Я никогда не использовал комбинатор с Gora, но работает ли он (или какую ошибку он показывает)?:
GoraReducer.initReducerJob(job, hostStore, My_Reducer.class);
job.setCombinerClass(My_Reducer.class);