Доступ к файлам WordNet в приложении Android

Я пишу словесную игру в Android. Это мое первое приложение, поэтому мои знания почти отсутствуют.

То, что я хотел бы сделать, это использовать JWI для доступа к словарю WordNet. Для этого необходимо указать путь к файлу словаря WordNet.

Из того, что я прочитал, Android-ресурсы недоступны через простой путь к файлу, но JWI требует для инициализации словарного API-интерфейса WordNet URL-адрес для расположения файлов словаря на диске.

Итак, каков наилучший курс действий? Должен ли я скопировать активы во время запуска в известную папку на устройстве Android? Я не могу придумать лучшего пути, но это кажется мне совершенно глупым.

Любая помощь с благодарностью получена.

2 ответа

У меня та же проблема (для веб-приложения для молы, но не для Android), и я попробовал эти два подхода, но безуспешно:

JWNL.initialize(this.getClass().getClassLoader().getResourceAsStream("wordnet_properties.xml");
dict = Dictionary.getInstance();

Здесь он успешно загружает wordnet_properties.xml, но не может получить доступ к словарю, на который указывает файл свойств.

Используя папку словаря напрямую:

String dictPath = "models/en/wordnet/dict/";
URL url = this.getClass().getClassLoader().getResource(dictPath);
System.out.println("loading wordnet from "+url);
dict = new RAMDictionary(url, ILoadPolicy.NO_LOAD);

Здесь я получаю URL словаря jar:file:/home/myusername/.m2/repository/package/1.0-SNAPSHOT/commons-1.0-SNAPSHOT.jar!/models/en/wordnet/dict/, WordNet, однако, не принимает протокол JAR и выдает ошибку:

java.lang.IllegalArgumentException: URL source must use 'file' protocol
    at edu.mit.jwi.data.FileProvider.toFile(FileProvider.java:693)
    at edu.mit.jwi.data.FileProvider.open(FileProvider.java:304)
    at edu.mit.jwi.DataSourceDictionary.open(DataSourceDictionary.java:92)
    at edu.mit.jwi.RAMDictionary.open(RAMDictionary.java:216)

Следующим моим исследованием будет создание подкласса для RAMDictionary или чего-то подобного, пожалуйста, сообщите мне, если вы нашли решение в то же время.

PS: я только что написал разработчику письмо с просьбой о помощи после того, как попытался переписать FileProvider, чтобы использовать ресурсы вместо этого, но через один или два часа я сдался, потому что код вызывает так много другого кода, который также работает только с файлами. Я буду держать вас в курсе!

PPS: я получил ответ от разработчика, в котором говорится, что это принципиально невозможно с потоками, потому что они не предлагают произвольный доступ, который необходим. Тем не менее, он предложил реализовать решение для загрузки всего этого в ОЗУ, если это действительно необходимо, но это потребовало бы около 500 МБ, и я думаю, что это слишком много для приложений для Android, поэтому я думаю, что все же лучше распаковать его где-нибудь.

PS: Вот мое решение для распаковки (вы можете заменить операторы System.out.println на операторы логгера, если вы используете логирование, или удалить их, если они вам не нравятся):

import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.URISyntaxException;
import java.util.Enumeration;
import java.util.jar.JarEntry;
import java.util.jar.JarFile;

/** Allows WordNet to be run from within a jar file by unpacking it to a temporary directory.**/
public class WordNetUnpacker
{
    static final String ID = "178558556719"; // minimize the chance of interfering  with an existing directory  
    static final String jarDir = "models/en/wordnet/dict";

    /**If running from within a jar, unpack wordnet from the jar to a temp directory (if not already done) and return that.
     * If not running from a jar, just return the existing wordnet directory.
     * @see getUnpackedWordNetDir(Class)*/
    static File getUnpackedWordNetDir() throws IOException
    {return getUnpackedWordNetDir(WordNetUnpacker.class);}

    /**If running from within a jar, unpack wordnet from the jar to a temp directory (if not already done) and return that.
     * If not running from a jar, just return the existing wordnet directory.
     * @param clazz the class in whose classloader the wordnet resources are found.
     * @see getUnpackedWordNetDir()**/

    static File getUnpackedWordNetDir(Class clazz) throws IOException
    {
        String codeSource = clazz.getProtectionDomain().getCodeSource().getLocation().getPath();
        System.out.println("getUnpackedWordNetDir: using code source "+codeSource);
        if(!codeSource.endsWith(".jar"))
        {
            System.out.println("not running from jar, no unpacking necessary");
            try{return new File(WordNetUnpacker.class.getClassLoader().getResource(jarDir).toURI());}
            catch (URISyntaxException e) {throw new IOException(e);}
        }
        try(JarFile jarFile = new JarFile(codeSource))
        {
            String tempDirString = System.getProperty("java.io.tmpdir");
            if(tempDirString==null) {throw new IOException("java.io.tmpdir not set");}
            File tempDir = new File(tempDirString);
            if(!tempDir.exists()) {throw new IOException("temporary directory does not exist");}
            if(!tempDir.isDirectory()) {throw new IOException("temporary directory is a file, not a directory ");}
            File wordNetDir = new File(tempDirString+'/'+"wordnet"+ID);
            wordNetDir.mkdir();
            System.out.println("unpacking jarfile "+jarFile.getName());
            copyResourcesToDirectory(jarFile, jarDir, wordNetDir.getAbsolutePath());
            return wordNetDir;
        }       
    }
    /** Copies a directory from a jar file to an external directory. Copied from <a href="http://stackru.com/a/19859453/398963">Stack Overflow</a>. */
    public static void copyResourcesToDirectory(JarFile fromJar, String jarDir, String destDir) throws IOException
    {
        int copyCount = 0;
        for (Enumeration<JarEntry> entries = fromJar.entries(); entries.hasMoreElements();)
        {
            JarEntry entry = entries.nextElement();
            if(!entry.getName().contains("models")) continue;
            if (entry.getName().startsWith(jarDir) && !entry.isDirectory()) {
                copyCount++;
                File dest = new File(destDir + "/" + entry.getName().substring(jarDir.length() + 1));
                File parent = dest.getParentFile();
                if (parent != null) {
                    parent.mkdirs();
                }

                FileOutputStream out = new FileOutputStream(dest);
                InputStream in = fromJar.getInputStream(entry);

                try {
                    byte[] buffer = new byte[8 * 1024];

                    int s = 0;
                    while ((s = in.read(buffer)) > 0) {
                        out.write(buffer, 0, s);
                    }
                } catch (IOException e) {
                    throw new IOException("Could not copy asset from jar file", e);
                } finally {
                    try {
                        in.close();
                    } catch (IOException ignored) {}
                    try {
                        out.close();
                    } catch (IOException ignored) {}
                }
            }
        }
        if(copyCount==0) System.out.println("Warning: No files copied!");
    }
}

Вы можете просто скопировать все файлы dict из "активов" во внутренний каталог вашего приложения. Просто сделайте это один раз, при первом запуске приложения. С тех пор вы можете использовать JWI таким образом:

String path = getFilesDir() + "/dict";
URL url = new URL("file", null, path);
IDictionary dict = new Dictionary(url);
Другие вопросы по тегам