Pyspark- Можно ли создать фрейм данных непосредственно из файла .tar.gz в Databricks?

У меня есть файл.tar.gz в ведре S3. Файлы.tar.gz содержат несколько файлов.tsv. Я хочу создать фрейм данных Spark (а не фрейм данных pandas) из одного из файлов.tsv в блоках данных, не распаковывая и не распаковывая его и не сохраняя во временном пути в блоках данных. Это возможно?

0 ответов

Другие вопросы по тегам