JSONDecodeError с py_translator (google-translate): как заставить библиотеку работать для новых переводов?
Я пытаюсь использовать Google Translate Api, чтобы перевести текст, содержащийся в огромном CSV-файле kaggle, который я преобразовал в dataframe.
Я попытался с помощью Googletrans, который дает эту ошибку:
AttributeError: 'NoneType' object has no attribute 'group'
но это, кажется, повторяющаяся ошибка, как об этом сообщалось здесь.
Я переключился на py_translator, который также использует Google Translate. Сначала он работал нормально, и я мог попробовать, как указано в руководстве, такую простую команду:
from py_translator import Translator
s = Translator().translate(text='Hello my friend', dest='es').text
print(s)
Однако после попытки применить его к моему фрейму данных, который содержит 156 060 строк, потому что я, должно быть, забыл ограничение API 5K или 15K, он полностью перестал работать, и я больше не могу запустить приведенный выше код, поскольку он всегда вызывает одну и ту же ошибку:
JSONDecodeError: Expecting value: line 1 column 1 (char 0)
код, который я использовал перед тем, как столкнулся с этой ошибкой, был:
df = pd.DataFrame(index=range(0,len(train)),columns=['translation'])
translator = Translator()
for i, row in enumerate(train['text']):
df.loc[i,'translation'] = translator.translate(row,dest='Fr').text
Произошла ошибка, но первые строки кадра данных были правильно переведены. Однако с тех пор я не могу получить какой-либо результат, используя какие-либо функции py_translator, и это может быть связано с ограничениями, предложенными здесь или здесь.
1) Как можно повторно использовать перевод py_translator для простых запросов и не сталкиваться с одной и той же ошибкой снова и снова в коде, который раньше работал?
2) Есть ли лучшая библиотека или лучший способ перевести большой набор данных?
Большое спасибо