Как я могу реализовать семантическую аннотацию в Python?
Семантическая аннотация - это процесс присоединения дополнительной информации к различным понятиям (например, людям, вещам, местам, организациям и т. Д.) В данном тексте или любом другом контенте.
Например, семантически аннотировать выбранные концепции в предложении "Аристотель, автор Политики основал Лицей" означает идентифицировать Аристотеля как личность, а Политику - как письменное произведение политической философии, а также дополнительно индексировать, классифицировать и связывать идентифицированные концепции в база данных семантических графов.
Первоначальные шаги для семантической аннотации - это идентификация текста и анализ текста, который может быть выполнен, но дальнейшие шаги, то есть извлечение концепции и извлечение отношений из текста, с которым я застрял, требуется для индексации и хранения в базе данных семантического графа.
2 ответа
То, что вы ищете здесь - это то, что является областью знаний, известной как изучение естественного языка. Человеческая семантика очень сложна, потому что наши структуры не так структурированы. Отличная библиотека Python для изучения и реализации NLP - Natural Language Toolkit ( NLTK). Удачи:)
Похоже, вы ищете безымянный классификатор сущностей (например, NER, но не только для именованных сущностей). Если вы хотите Python, вот тот, который поддерживает английский: