Как получить имя входного файла в коде Mapper в программе Hadoop Map Reduce
Я написал код драйвера с двумя входными аргументами: args[0] и args[1].
Я хочу использовать args [0], то есть путь к входному файлу, в качестве одного из моих путей к файлу в коде картографа, чтобы мой читатель буфера мог прочитать файл, как показано ниже:
{
public void map(LongWritable key, Text value, Context context)
throws java.io.IOException, InterruptedException {
ArrayList<String> al=new ArrayList<String>();
ArrayList<String> nl =new ArrayList<String>();
String line = null;
String filePath = args [0]; String path = args [1];
try {
FileReader fileReader =
new FileReader(filePath);
BufferedReader bufferedReader =
new BufferedReader(fileReader);
while((line = bufferedReader.readLine()) != null)
{
if(line.contains("result") && line.contains("Complete_IND"))
{
String pattern1 = "venk";
String pattern2 = "si";
Pattern p = Pattern.compile(Pattern.quote(pattern1) + "(.*?)" + Pattern.quote(pattern2));
Matcher m = p.matcher(line);
while (m.find()) {
System.out.println(m.group(1));
String num=m.group(1);
int fin=Integer.parseInt(m.group(1));
if(fin>0)
{
System.out.println("number greater than zero"+fin);
al.add(num);
for(String obj:al)
{System.out.println("final obj"+obj);}}
}
}
}
// Always close files.
bufferedReader.close();
// for(String obj:al){
// System.out.println(obj);
//}
}
catch(FileNotFoundException ex) {
System.out.println(
"Unable to open file '" +
filePath + "'");
}
catch(IOException ex) {
System.out.println(
"Error reading file '"
+ filePath + "'");
// Or we could just do this:
// ex.printStackTrace();
}
System.out.println("secondloop");
try {
// FileReader reads text files in the default encoding.
FileReader fileReader =
new FileReader(path);
// Always wrap FileReader in BufferedReader.
BufferedReader bufferedReader =
new BufferedReader(fileReader);
System.out.println("djdne"+path);
// Always wrap FileReader in BufferedReader.
BufferedReader bufferReader =
new BufferedReader(fileReader );
System.out.println("djdne"+path);
while((line = bufferReader.readLine()) != null)
{
System.out.println("djdne"+line);
for(String obj:al) {
if(line.contains(obj))
{
System.out.println("77");
System.out.println("1 obj is"+obj);
String pattern1 = "|";
String pattern2 = "|";
Pattern pt = Pattern.compile(Pattern.quote(pattern1) + "(.*?)" + Pattern.quote(pattern2));
Matcher mac = pt.matcher(line);
System.out.println("22");
while (mac.find()) {
System.out.println("33");
System.out.println(mac.group(1));
nl.add(mac.group(1));
for(int i=0;i<nl.size();i++)
{
Text si= new Text(al.get(i));
Text vi=new Text(nl.get(i));
context.write(si, vi);
}
}
}
}
}
bufferReader.close();
}
catch(FileNotFoundException ex) {
System.out.println(
"Unable to open file '" +
path + "'");
}
catch(IOException ex) {
System.out.println(
"Error reading file '"
+ path + "'");
// Or we could just do this:
// ex.printStackTrace();
}
}
}
2 ответа
Решение
Вы можете получить его из контекста маппера и текущего разделения входных данных.
((FileSplit) context.getInputSplit()).getPath();
В классе конфигурации Mapper вы можете получить имя файла. Тогда вы можете использовать его для чтения. Пример более подробно
public void configure(JobConf job) {
inputFile = job.get("mapred.input.file");
}