Не удается загрузить файлы кастры с помощью функции dask from_castra()

Я пытаюсь повторить пример этой страницы о комментариях к castra, dask и reddit, и я получаю вышеуказанную ошибку при запуске

dd.from_castra(данные, столбцы)

Создание моего файла кастры заняло несколько часов, но он чистый и именно так, как упоминается в руководстве.

Использовал мой macbook и экземпляр Ubuntu на Amazon AWS и имел ту же проблему.

Тот же код и файл отлично работает в Windows PC.

Любая информация может быть полезной!

ValueError: Ожидаемый повторяемый набор кортежей (name, dtype), полученный ['archived', 'author',....]

2 ответа

Решение

Я нашел решение проблемы. Это был вопрос версий. Если вы столкнулись с той же проблемой, сделайте следующее:

Шаг 1:

Удалите dask используя pip

pip uninstall dask

Шаг 2:

Удалите кастру, используя pip

pip uninstall castra

Шаг 3:

Установите версию dask, совместимую с Castra

pip install -Iv dask==0.10.0

Шаг 4:

Установите кастру снова

pip install castra

Шаг 5:

После установки правильной версии проверьте свои версии с помощью следующих команд

pip show dask
pip show castra

Версии должны быть такими же, как на скриншоте:

экран терминала

Castra был экспериментальным проектом и больше не поддерживается. Смотрите README https://github.com/blaze/castra

Другие вопросы по тегам