Проверьте, какое слово является реальным и часто используемым

У меня есть база данных с 70 тыс. Ключевых слов, собранных из моих данных. Проблема в том, что некоторые (10-15%) слов не являются реальными часто используемыми ключевыми словами. Как я могу проверить, какие из них не очень хорошие слова, чтобы я мог почистить свой стол? Есть ли у кого-нибудь идея?

1 ответ

Используйте инструмент типа словаря, который имеет API, чтобы вы могли сравнить слова в вашей базе данных со словами в базе данных инструментов словаря.

РЕДАКТИРОВАТЬ:
Когда-то такой инструмент, который вы могли бы найти полезным, является API Dictionary.com

Вы также можете поискать следующее в системах Linux:

/usr/share/dict/ 
/var/lib/dict/
Другие вопросы по тегам