Правописание библиотек (например, hunspell) в приложениях UWP?

Question

Правописание библиотек (например, hunspell) в приложениях UWP?

Я портирую приложение для писателей на платформу UWP. Единственная часть головоломки, которую я оставил, - это библиотека NHunspell. Я широко использую его для проверки орфографии и функций тезауруса. Я настроил черт из него и создал пользовательские словари для разных вещей (т.е. разные словари для каждого пишущего проекта). Эта библиотека прекрасная вещь.

Тем не менее, я не могу включить эту DLL в мое приложение UWP.

1) Есть ли способ заставить использование этой DLL? Мне действительно нравится, как настроена система NHunSpell. Это имеет смысл и очень быстро и просто в использовании.

2) Если нет, может кто-нибудь порекомендовать лучшее решение для пользовательских словарей, настраиваемой проверки орфографии и т. Д.?

Обновление 3

После значительного обновления и чтения в Интернете, я нашел ссылку, обсуждающую теорию проверки орфографии. Вот один быстрый пример (тот, который я использовал больше всего).

http://www.anotherchris.net/csharp/how-to-write-a-spelling-corrector-in-csharp/

После прочтения этой статьи, взятия этого базового кода и извлечения английских слов из файлов Hunicpell.dic я создал свою собственную библиотеку для проверки орфографии, которая работает в UWP.

Как только я получу подтверждение, я опубликую его как ответ ниже, чтобы пожертвовать SO-сообществу.:)

Обновление 2

Я допускаю использование Hunspell . Не похоже, что это вообще возможно... есть ли другие библиотеки / пакеты, которые кто-нибудь может предложить?

ОБНОВИТЬ:

Мне, вероятно, нужно перефразировать утверждение, что я не могу включить DLL: я не могу включить DLL через NuGet. Он жалуется, что DLL не совместима с платформой UAP/UWP.

Я могу вручную включить DLL в свой проект, связавшись с существующей DLL (не NuGet). Однако эта DLL действительно оказывается несовместимой с платформой UAP. Простой вызов проверки орфографии слова прекрасно работает в WinForms, но сразу же вылетает с System.IO.FileNotFoundException,

Конструктор NHunspell действительно пытается загрузить связанный .dic а также .aff файлы. Однако я смягчил это, загрузив файлы в память, а затем вызвал альтернативный конструктор, который принимает байтовый массив вместо имени файла для каждого из этих файлов. Это все еще вылетает, но с новым Method not found ошибка:

String System.AppDomain.get_RelativeSearchPath()

Я ищу любой механизм проверки орфографии, который будет работать в рамках UAP. Я бы предпочел, чтобы это был NHunspell просто по причинам фамильярности. Тем не менее, я не закрываю глаза на тот факт, что это становится все менее возможным в качестве варианта.

Люди, с которыми я работаю, предложили использовать встроенные опции проверки орфографии. Однако я не могу использовать встроенные функции проверки орфографии в Windows 10/TextBox (о которых я знаю), потому что я не могу управлять пользовательскими словарями и не могу отключить такие вещи, как автокапитализация и замена слов (где он заменяет слово для вас, если считает, что оно достаточно близко к правильному предположению). Эти вещи являются главой самоубийства для писателей! Автор может отключить их на уровне операционной системы, но он может включить их для других приложений, но только не для этого.

Пожалуйста, дайте мне знать, если есть обходной путь для NHunspell. И если вы не знаете обходного пути, пожалуйста, дайте мне знать ваш лучший замененный пользовательский механизм проверки орфографии, который работает в рамках UAP.

В качестве примечания я также использую NHunspell для его возможности тезауруса. Это работает очень хорошо в моих приложениях Windows. Я также должен был бы заменить эту функциональность - надеюсь, тем же механизмом, что и механизм проверки орфографии. Однако, если вам известен хороший движок тезауруса (но он не проверяет орфографию), это тоже хорошо!

Спасибо!!

5

c# win-universal-app hunspell nhunspell

Источник

user53531 18 мар '16 в 00:05

3 ответа

Другие вопросы по тегам c# win-universal-app hunspell nhunspell

user5684370 20 мар '16 в 16:22 2016-03-20 16:22 · Answer 1 · 2016-03-20 16:22

Я загружаю исходный код библиотеки NHunspell и пытался создать библиотеку с поддержкой UWP, однако обнаружил проблемы с Marshalling (Marshalling.cs)
Пакет загружает dll, который работает только в архитектуре x86 и x64, поэтому приложение arm (мобильные телефоны, планшеты) не будет работать.
Пакет загружает dll с помощью системных вызовов:

    [DllImport("kernel32.dll")]
    internal static extern IntPtr LoadLibrary(string fileName);

и я думаю, что это нужно переписать для работы в UWP, потому что UWP использует песочницу.

ИМХО есть только два варианта:
1) Перепишите класс Marshalling с ограничениями UWP.
2) Не используйте Hunspell в вашей программе.

У меня нет больших знаний о dll с UWP, но я считаю, что переписать может быть очень сложно.

user53531 25 мар '16 в 14:17 2016-03-25 14:17 · Answer 2 · 2016-03-25 14:17

Как и было обещано, вот класс, который я построил для проверки правописания.

using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;
using System.Threading.Tasks;

namespace Com.HanelDev.HSpell
{
    public class HSpellProcess
    {
        private Dictionary<string, string> _dictionary = new Dictionary<string, string>();

        public int MaxSuggestionResponses { get; set; }

        public HSpellProcess()
        {
            MaxSuggestionResponses = 10;
        }

        public void AddToDictionary(string w)
        {
            if (!_dictionary.ContainsKey(w.ToLower()))
            {
                _dictionary.Add(w.ToLower(), w);
            }
            else
            {
                // Upper case words are more specific (but may be the first word
                // in a sentence.) Lower case words are more generic.
                // If you put an upper-case word in the dictionary, then for
                // it to be "correct" it must match case. This is not true
                // for lower-case words.
                // We want to only replace existing words with their more
                // generic versions, not the other way around.
                if (_dictionary[w.ToLower()].CaseSensitive())
                {
                    _dictionary[w.ToLower()] = w;
                }
            }
        }

        public void LoadDictionary(byte[] dictionaryFile, bool resetDictionary = false)
        {
            if (resetDictionary)
            {
                _dictionary = new Dictionary<string, string>();
            }
            using (MemoryStream ms = new MemoryStream(dictionaryFile))
            {
                using (StreamReader sr = new StreamReader(ms))
                {
                    string tmp = sr.ReadToEnd();
                    tmp = tmp.Replace("\r\n", "\r").Replace("\n", "\r");
                    string [] fileData = tmp.Split("\r".ToCharArray());

                    foreach (string line in fileData)
                    {
                        if (string.IsNullOrWhiteSpace(line) || line.StartsWith("#"))
                        {
                            continue;
                        }

                        string word = line;

                        // I added all of this for file imports (not array imports)
                        // to be able to handle words from Hunspell dictionaries.
                        // I don't get the hunspell derivatives, but at least I get
                        // the root word.
                        if (line.Contains("/"))
                        {
                            string[] arr = line.Split("/".ToCharArray());
                            word = arr[0];
                        }

                        AddToDictionary(word);
                    }
                }
            }
        }

        public void LoadDictionary(Stream dictionaryFileStream, bool resetDictionary = false)
        {
            string s = "";
            using (StreamReader sr = new StreamReader(dictionaryFileStream))
            {
                s = sr.ReadToEnd();
            }

            byte [] bytes = Encoding.UTF8.GetBytes(s);

            LoadDictionary(bytes, resetDictionary);
        }

        public void LoadDictionary(List<string> words, bool resetDictionary = false)
        {
            if (resetDictionary)
            {
                _dictionary = new Dictionary<string, string>();
            }

            foreach (string line in words)
            {
                if (string.IsNullOrWhiteSpace(line) || line.StartsWith("#"))
                {
                    continue;
                }

                AddToDictionary(line);
            }
        }

        public string ExportDictionary()
        {
            StringBuilder sb = new StringBuilder();

            foreach (string k in _dictionary.Keys)
            {
                sb.AppendLine(_dictionary[k]);
            }

            return sb.ToString();
        }

        public HSpellCorrections Correct(string word)
        {
            HSpellCorrections ret = new HSpellCorrections();
            ret.Word = word;

            if (_dictionary.ContainsKey(word.ToLower()))
            {
                string testWord = word;
                string dictWord = _dictionary[word.ToLower()];
                if (!dictWord.CaseSensitive())
                {
                    testWord = testWord.ToLower();
                    dictWord = dictWord.ToLower();
                }

                if (testWord == dictWord)
                {
                    ret.SpelledCorrectly = true;
                    return ret;
                }
            }

            // At this point, we know the word is assumed to be spelled incorrectly. 
            // Go get word candidates.
            ret.SpelledCorrectly = false;

            Dictionary<string, HSpellWord> candidates = new Dictionary<string, HSpellWord>();

            List<string> edits = Edits(word);

            GetCandidates(candidates, edits);

            if (candidates.Count > 0)
            {
                return BuildCandidates(ret, candidates);
            }

            // If we didn't find any candidates by the main word, look for second-level candidates based on the original edits.
            foreach (string item in edits)
            {
                List<string> round2Edits = Edits(item);

                GetCandidates(candidates, round2Edits);
            }

            if (candidates.Count > 0)
            {
                return BuildCandidates(ret, candidates);
            }

            return ret;
        }

        private void GetCandidates(Dictionary<string, HSpellWord> candidates, List<string> edits)
        {
            foreach (string wordVariation in edits)
            {
                if (_dictionary.ContainsKey(wordVariation.ToLower()) &&
                    !candidates.ContainsKey(wordVariation.ToLower()))
                {
                    HSpellWord suggestion = new HSpellWord(_dictionary[wordVariation.ToLower()]);

                    suggestion.RelativeMatch = RelativeMatch.Compute(wordVariation, suggestion.Word);

                    candidates.Add(wordVariation.ToLower(), suggestion);
                }
            }
        }

        private HSpellCorrections BuildCandidates(HSpellCorrections ret, Dictionary<string, HSpellWord> candidates)
        {
            var suggestions = candidates.OrderByDescending(c => c.Value.RelativeMatch);

            int x = 0;

            ret.Suggestions.Clear();
            foreach (var suggest in suggestions)
            {
                x++;
                ret.Suggestions.Add(suggest.Value.Word);

                // only suggest the first X words.
                if (x >= MaxSuggestionResponses)
                {
                    break;
                }
            }

            return ret;
        }

        private List<string> Edits(string word)
        {
            var splits = new List<Tuple<string, string>>();
            var transposes = new List<string>();
            var deletes = new List<string>();
            var replaces = new List<string>();
            var inserts = new List<string>();

            // Splits
            for (int i = 0; i < word.Length; i++)
            {
                var tuple = new Tuple<string, string>(word.Substring(0, i), word.Substring(i));
                splits.Add(tuple);
            }

            // Deletes
            for (int i = 0; i < splits.Count; i++)
            {
                string a = splits[i].Item1;
                string b = splits[i].Item2;
                if (!string.IsNullOrEmpty(b))
                {
                    deletes.Add(a + b.Substring(1));
                }
            }

            // Transposes
            for (int i = 0; i < splits.Count; i++)
            {
                string a = splits[i].Item1;
                string b = splits[i].Item2;
                if (b.Length > 1)
                {
                    transposes.Add(a + b[1] + b[0] + b.Substring(2));
                }
            }

            // Replaces
            for (int i = 0; i < splits.Count; i++)
            {
                string a = splits[i].Item1;
                string b = splits[i].Item2;
                if (!string.IsNullOrEmpty(b))
                {
                    for (char c = 'a'; c <= 'z'; c++)
                    {
                        replaces.Add(a + c + b.Substring(1));
                    }
                }
            }

            // Inserts
            for (int i = 0; i < splits.Count; i++)
            {
                string a = splits[i].Item1;
                string b = splits[i].Item2;
                for (char c = 'a'; c <= 'z'; c++)
                {
                    inserts.Add(a + c + b);
                }
            }

            return deletes.Union(transposes).Union(replaces).Union(inserts).ToList();
        }

        public HSpellCorrections CorrectFrom(string txt, int idx)
        {
            if (idx >= txt.Length)
            {
                return null;
            }

            // Find the next incorrect word.
            string substr = txt.Substring(idx);
            int idx2 = idx;

            List<string> str = substr.Split(StringExtensions.WordDelimiters).ToList();

            foreach (string word in str)
            {
                string tmpWord = word;

                if (string.IsNullOrEmpty(word))
                {
                    idx2++;
                    continue;
                }

                // If we have possessive version of things, strip the 's off before testing
                // the word. THis will solve issues like "My [mother's] favorite ring."
                if (tmpWord.EndsWith("'s"))
                {
                    tmpWord = word.Substring(0, tmpWord.Length - 2);
                }

                // Skip things like ***, #HashTagsThatMakeNoSense and 1,2345.67
                if (!tmpWord.IsWord())
                {
                    idx2 += word.Length + 1;
                    continue;
                }

                HSpellCorrections cor = Correct(tmpWord);

                if (cor.SpelledCorrectly)
                {
                    idx2 += word.Length + 1;
                }
                else
                {
                    cor.Index = idx2;
                    return cor;
                }
            }

            return null;
        }
    }
}

user48003 09 май '16 в 08:21 2016-05-09 08:21 · Answer 3 · 2016-05-09 08:21

Вы можете использовать встроенную в Windows проверку правописания, чтобы лучше контролировать ее поведение. А затем примените свои результаты к текстовому элементу управления самостоятельно.

Посмотрите на ISpellChecker. Это позволяет вам добавлять свой собственный словарь и имеет гораздо больше возможностей для управления его поведением. И да, это доступно для UWP.