Должен ли я сделать свой собственный или использовать существующий английский лексикон?
Мой предыдущий вопрос был закрыт из-за неопределенности. Я хочу получить совет по этому вопросу, в настоящее время я работаю над приложением вопросов и ответов, и метод, который я счел нужным с этим, Parsing
, Идея здесь в том, что программа определит, о каком типе слова говорят, тем самым программа определит, что это за слово. Topic/Idea
указанного вопроса.
Пример:
What is Computers?
- Что - вопросительное местоимение.
- это - глагол.
- Компьютер - Тема.
Компьютер будет искать слово Computer
в файле PDF/TXT. Вопрос здесь Should i make my own Simple Lexicon? or use a existing one
Мне не нужна большая библиотека слов, мне нужны только самые простые. Что вы думаете, ребята?
PS: я использую Javascript в качестве своего языка выбора.
Спасибо
1 ответ
Разбор английского таким способом практически невозможен для компьютера.
- Английский часто бывает позиционным. Слову нельзя присвоить категорию, не зная его контекста в остальной части предложения.
- Английский нуждается в контексте. Такие слова, как "это", "он" или "the" относятся к другим словам в предложении и часто требуют знания значения предложения для их анализа.
Возможно, вам больше повезет со статистическим подходом.
На странице Википедии много информации: