Получить все метаданные файла apache tika TikaJAXRS
Привет, я развернул https://wiki.apache.org/tika/TikaJAXRS на сервере, и когда я загружаю файл и звоню /meta
я получаю ответ ниже для файла docx
u'{"Content-Encoding":"UTF-16LE","Content-Type":"application/json; charset\u003dUTF-16LE","X-Parsed-By":["org.apache.tika.parser.DefaultParser","org.apache.tika.parser.txt.TXTParser"],"язык": "млрд"}")
1.File язык английский, но тика возвращает "бн"?
2. Это единственные метаданные, которые я получу? как насчет владельца файла и т. д.?
Код: я использую Python
body= open('/home/Desktop/aws/0.docx','rb')
files = {'upload_file': body}
headers = {'content-type': 'application/octet-stream'}
r = requests.put('http://xx.xx/meta',
files=files,headers=headers)
print('text',r.text)