JNIUS & TIKA - ошибка при попытке parseToString

Попытался запустить tike-приложение с помощью jnius, но возникла проблема (macOS Sierra, Java 1.8 JDK, Python 2.7 и Python 3.6) Все работает нормально (вывод для tika.detect в порядке) до parseToString команда. Кажется, есть всплывающее окно, если вы запускаете эту команду (проверено также с помощью Java-программы, и она работает). Но при работе с jnius он перестает работать, и нет вывода и нет ошибки.

import os

os.environ['CLASSPATH'] = "tika-app-1.14.jar"
from jnius import autoclass
from jnius import JavaException

# Import the Java classes
Tika = autoclass('org.apache.tika.Tika')
Metadata = autoclass('org.apache.tika.metadata.Metadata')
File = autoclass('java.io.File')

# Raise an exception and continue if parsing fails
try:
    file = File('./source/test.doc')
    tika = Tika()
    meta = Metadata()
    detectText = tika.detect(file)
    print(detectText) # Working the output is: application/msword
    contentText = tika.parseToString(file) #here it stops no further steps are executed
    print(contentText)
except (JavaException,UnicodeDecodeError) as e:
    print("ERROR: %s" % (e))

1 ответ

Решение

Наконец-то я нашел решение. В JVM отсутствует опция, указывающая tiki.jar на использование режима без головы.

#Config have to be before import minus
import jnius_config
jnius_config.add_options('-Djava.awt.headless=true')

import os
os.environ['CLASSPATH'] = "tika-app-1.14.jar"

from jnius import autoclass

## Import the Java classes we are going to need
Tika = autoclass('org.apache.tika.Tika')
Metadata = autoclass('org.apache.tika.metadata.Metadata')
FileInputStream = autoclass('java.io.FileInputStream')

tika = Tika()
meta = Metadata()
text = tika.parseToString(FileInputStream("./source/test.doc"), meta)
print(text)
Другие вопросы по тегам