scala spark - подсчет четных чисел из файла

Я новичок в мире больших данных. Нужна ваша помощь, чтобы сделать это реальностью. Вот мой вопрос. Я читаю данные из txt файла (1,2,3,4,4,4,4)

var file=sc.textFile("file:///home/cloudera/MyData/Lab1/numbers.txt")
var number=file.flatMap(line=>line.split(","))
var intNumbers=number.map(num=>num.toInt)//Error
intNumbers.collect()

java.lang.NumberFormatException: для входной строки: ""

ошибка из-за того, что последний элемент массива не может быть преобразован в Int

Пожалуйста, помогите на этом Спасибо заранее.

С уважением, Изучение Спарк

1 ответ

Решение

У вас есть фильтр пустой строки перед приведением к Integer.

var file=sc.textFile("file:///home/cloudera/MyData/Lab1/numbers.txt")
var number=file.flatMap(line=>line.split(",")).filter(num => num != "")
var intNumbers=number.map(num=>num.toInt)//Error
intNumbers.collect()
Другие вопросы по тегам