Использование функций hdbscan непосредственно в Zeppelin для отладки
Я использую HDBSCAN для выполнения кластеризации клиентов, но у меня возникают проблемы с измерением достоверности кластеров (вычисление индекса DBCV). Я получаю наны для некоторых кластеров, и я не понимаю, почему (я не могу поделиться данными, и при попытке использовать фиктивные данные я не сталкиваюсь с этим).
Итак, поскольку я использую записные книжки Zeppelin и не могу устанавливать / редактировать пакеты и т. Д., Я решил скопировать функции из github HDBSCAN и отредактировать их для отладки, выполнить проверки, чтобы исправить мою проблему. Проблема в том, что если я пытаюсь запустить код внутри _hdbscan_linkage.pyx, я получаю синтаксическую ошибку:
cimport numpy as np
Traceback (most recent call last):
File "/tmp/zeppelin_python-7830904909104475083.py", line 295, in <module>
code = compile('\n'.join(final_code), '<stdin>', 'exec', ast.PyCF_ONLY_AST, 1)
File "<stdin>", line 1
cimport numpy as np
^
SyntaxError: invalid syntax
Почему я могу использовать функции в этом ноутбуке.pyx после того, как пакет установлен в Zeppelin, но не может запускать функции отдельно в ноутбуках? Я знаю, что Cython не является интерпретатором Zeppelin, но до сих пор неясно, как работает код, если он установлен с помощью hdbscan. Спасибо за вашу поддержку.