Hadoop map.input.start не граница линии?
Кажется, что свойство map.input.start не дает мне положение начала строки (за исключением, конечно, первого map.input.start, который равен 0). Иногда map.input.start находится где-то посередине первой строки ввода преобразователя, иногда где-то посередине последней строки ввода предыдущего преобразователя. Этого следовало ожидать? Если так, как я могу получить байтовые смещения линий? с помощью TextInputFormat
не работает, потому что я использую потоковую передачу Hadoop, которая отбрасывает ключ к мапперу