Как я могу прочитать сжатые разреженные тензорные данные в Python?
Я пытаюсь использовать http://frostt.io/ «s наборов данных , но я не уверен , как читать их в питон.
Я думал, что gzip.open(*) может работать; однако при просмотре двоичного файла из файла он имеет неправильный размер (как указано на их веб-сайте). Скорее всего, это связано с тем, как я пытаюсь преобразовать его в массив.
Кроме того, насколько я могу судить, .tns - это то, что они разработали в качестве файловой структуры, поэтому я попытался изучить их код на github, но не думаю, что он имеет много пользы (насколько я могу судить).
Чем я сейчас занимаюсь:
with gzip.open("chicago-crime-comm.tns.gz", "rb" as f:
data = f.read()
t = np.frombuffer(data, dtype=np.byte)