Не удается загрузить файлы кастры с помощью функции dask from_castra()
Я пытаюсь повторить пример этой страницы о комментариях к castra, dask и reddit, и я получаю вышеуказанную ошибку при запуске
dd.from_castra(данные, столбцы)
Создание моего файла кастры заняло несколько часов, но он чистый и именно так, как упоминается в руководстве.
Использовал мой macbook и экземпляр Ubuntu на Amazon AWS и имел ту же проблему.
Тот же код и файл отлично работает в Windows PC.
Любая информация может быть полезной!
ValueError: Ожидаемый повторяемый набор кортежей (name, dtype), полученный ['archived', 'author',....]
2 ответа
Я нашел решение проблемы. Это был вопрос версий. Если вы столкнулись с той же проблемой, сделайте следующее:
Шаг 1:
Удалите dask используя pip
pip uninstall dask
Шаг 2:
Удалите кастру, используя pip
pip uninstall castra
Шаг 3:
Установите версию dask, совместимую с Castra
pip install -Iv dask==0.10.0
Шаг 4:
Установите кастру снова
pip install castra
Шаг 5:
После установки правильной версии проверьте свои версии с помощью следующих команд
pip show dask
pip show castra
Версии должны быть такими же, как на скриншоте:
Castra был экспериментальным проектом и больше не поддерживается. Смотрите README https://github.com/blaze/castra