Блоки данных Azure: ошибка pandas.read_parquet

У меня есть ошибка при чтении паркета в пандах в блоках данных, как показано ниже:

у кого-нибудь есть идея? Следующее - моя среда выполнения databricks.

моя версия панд

1 ответ

Панды не знают о файловой системе ABFSS. Чтобы прочитать этот файл, у вас есть несколько вариантов:

Вы также можете попробовать открыть файл с класса помощьюAzureDLFileSystem из пакета azure-datalake-store и передать дескриптор read_parquet - он работает для CSV, но я не уверен, что он будет работать с Parquet.

Также вы можете попробовать использовать пакет pyarrowfs-adlgen2 - он должен позволять читать файл, не загружая его локально.

Другие вопросы по тегам