Как построить словарь морфинга с помощью postgresql?

Мне нужно создать специальный морфологический словарь для естественного языка. Каждое слово должно содержать набор характеристик. Помогает ли PostgreSQL 9.* в такой ситуации? Я имею в виду: я должен создать таблицу с нуля или есть какие-то предопределенные средства?

1 ответ

Решение

Вы ищете вещи, выходящие далеко за рамки того, для чего предназначены типичные решения PostgreSQL. Лучше всего создать свой собственный стол.

Теперь я просто заинтересованный читатель языковых тем, но для морфологического анализа я подозреваю, что вы столкнетесь с проблемами с разными языками, имеющими принципиально разные морфологические системы. Например, морфологические концепции в австронезийских, индоевропейских и атабасканских (все, что я знаю достаточно, чтобы быть опасными) не кажутся мне очень подходящими для одной реляционной модели. Например, мы могли бы иметь различные морфологии для времен глагола в IE, но не два других. Редупликация в австронезийских языках добавляет некоторый изгиб (особенно когда речь идет о комбинациях префикс / суффикс / инфикс), и у Athabascan есть слоты, которые не соответствуют ожиданиям двух других языков в части речи.

Так что я не думаю, что вы, вероятно, найдете много общих схем баз данных морфинга вокруг. Вещи, вероятно, будут зависеть от языка и цели. Например, создание базы данных для поиска морфологических изменений между средним и современным английским языком будет сильно отличаться от того, что предназначено просто для анализа текущей морфологии, скажем, в твитах.

Другие вопросы по тегам