Выравнивание предложений для MT в Google AutoML
Google AutoML поставляется с инструментом выравнивания предложений?
У меня есть много документов на английском и итальянском языках, которые вручную переводят "почти" предложение за предложением, поэтому должно быть легко обнаружить переведенные предложения автоматически. Документы грамматически хорошо написаны относительно коротко: 5-10 предложений.
Есть ли такой инструмент в дорожной карте и какой будет хороший инструмент / подход для использования, пока он не будет включен в облачный сервис AutoML?
1 ответ
Я нашел несколько вариантов в Интернете, чтобы сделать это:
https://github.com/rsennrich/Bleualign
https://github.com/machinalis/yalign
https://github.com/danielvarga/hunalign
https://github.com/rali-udem/yasa
https://github.com/cocoxu/Shakespeare
https://www.microsoft.com/en-us/download/details.aspx?id=52608