Невозможно прочитать данные mongodb (json) в pyspark

Я подключаю базу данных mongodb через pymongo и добился ожидаемого результата извлечения ее за пределы базы данных в формате json. но моя задача состоит в том, чтобы мне нужно было создать таблицу кустов через pyspark, я обнаружил, что mongodb предоставил json (RF719), который не поддерживает spark. Когда я пытался загрузить данные в pyspark (dataframe), который он показывает как поврежденную запись., и если какие-либо возможные способы преобразования формата JSON в Python также хорошо.. Пожалуйста, предложите ответ

0 ответов

Mport json с open('D:/json/aaa.json') как f: d = f.read() da = ''.join(d.split()) print(type(da)) print(da) daa=da.replace('u'','') daaa= json.loads(daa) print(daaa) доволен ответом. Следовательно, закрывая этот вопрос

Другие вопросы по тегам