Читайте файлы.wav из hdfs на python, аналогичном librosa.load
У меня есть аудио файл.wav в HDFS. Если этот файл хранится в локальной файловой системе, я могу прочитать его, используя библиотеку librosa с librosa.load. Но я не могу использовать ту же функцию, если файл находится в HDFS.
Я попытался с помощью библиотеки HdfsCLI прочитать файл.wav следующим образом,
import struct
import numpy as np
from hdfs import InsecureClient
client = InsecureClient(host_port, user)
with client.read(filepath_in_hdfs) as f:
meta = struct.unpack('<iHHIIHH', f.read(20))
audio = np.frombuffer(f.read(), dtype=np.uint8)
print audio
Это дает мне вывод как:
[1, 0, 1,...., 247, 27, 248]
Когда я использую librosa.load для того же файла на локальном компьютере, вывод:
[0, 0, 0,....., 0, 0, 0]
Верны ли оба выхода? Если нет, есть ли другой способ, с помощью которого я могу загружать такие файлы так же, как загружает librosa?