Должен ли я сделать свой собственный или использовать существующий английский лексикон?

Мой предыдущий вопрос был закрыт из-за неопределенности. Я хочу получить совет по этому вопросу, в настоящее время я работаю над приложением вопросов и ответов, и метод, который я счел нужным с этим, Parsing, Идея здесь в том, что программа определит, о каком типе слова говорят, тем самым программа определит, что это за слово. Topic/Idea указанного вопроса.

Пример:

What is Computers?

  1. Что - вопросительное местоимение.
  2. это - глагол.
  3. Компьютер - Тема.

Компьютер будет искать слово Computer в файле PDF/TXT. Вопрос здесь Should i make my own Simple Lexicon? or use a existing oneМне не нужна большая библиотека слов, мне нужны только самые простые. Что вы думаете, ребята?

PS: я использую Javascript в качестве своего языка выбора.

Спасибо

1 ответ

Разбор английского таким способом практически невозможен для компьютера.

  • Английский часто бывает позиционным. Слову нельзя присвоить категорию, не зная его контекста в остальной части предложения.
  • Английский нуждается в контексте. Такие слова, как "это", "он" или "the" относятся к другим словам в предложении и часто требуют знания значения предложения для их анализа.

Возможно, вам больше повезет со статистическим подходом.

На странице Википедии много информации:

http://en.wikipedia.org/wiki/Natural_language_processing

Другие вопросы по тегам