Читайте файлы.wav из hdfs на python, аналогичном librosa.load

У меня есть аудио файл.wav в HDFS. Если этот файл хранится в локальной файловой системе, я могу прочитать его, используя библиотеку librosa с librosa.load. Но я не могу использовать ту же функцию, если файл находится в HDFS.

Я попытался с помощью библиотеки HdfsCLI прочитать файл.wav следующим образом,

import struct
import numpy as np
from hdfs import InsecureClient
client = InsecureClient(host_port, user)

with client.read(filepath_in_hdfs) as f:
    meta = struct.unpack('<iHHIIHH', f.read(20))
    audio = np.frombuffer(f.read(), dtype=np.uint8)
print audio

Это дает мне вывод как:

[1, 0, 1,...., 247, 27, 248]

Когда я использую librosa.load для того же файла на локальном компьютере, вывод:

[0, 0, 0,....., 0, 0, 0]

Верны ли оба выхода? Если нет, есть ли другой способ, с помощью которого я могу загружать такие файлы так же, как загружает librosa?

0 ответов

Другие вопросы по тегам