Инструментарий языкового моделирования

Я хотел бы построить модель языка для текстового корпуса. Существуют ли хорошие готовые наборы инструментов, которые облегчат мою задачу? Единственный известный мне инструментарий - это набор инструментов для статистического моделирования языков (SLM) от CMU.

С Уважением,

3 ответа

NLTK очень мощный, хотя я никогда не использовал его.

Набор инструментов SRILM очень полезен.

http://www.speech.sri.com/projects/srilm/

KenLM также стоит попробовать. Это быстро и использует хорошие настройки по умолчанию. В отличие от SRILM, он предлагает меньше возможностей для конфигурации.

Другие вопросы по тегам