Внутренняя структура SentiWordNet 3
Я работаю над проектом анализа настроений, который использует SentiwordNet3
словарный запас. Проблема в том, что я не могу понять структуру словарного запаса. Одна строка этого лексикона:
00002730 0 0 акроскопическая #1, обращенная или в сторону к вершине
1. a
знак равно Цель a
?
2. POS-ID=00002730
, Какова цель POS-ID
?
3. SynsetTerms Gloss
знак равно acroscopic#1 facing or on the side toward the apex
- Что такое
acroscopic
? Это слово, которое мы хотим, чтобы оценка? - Что такое
#1
? Цель? - Почему предложение после
#1
?facing or on the side toward the apex
,
Что касается доступа к счету, мы обращались к нему как
`list(SWN.senti_synsets(Tagged[i][0],'a')`
a
является Adjective
в то время как v
,r
а также n
также в лексиконе.
1 ответ
Корпус имеет заголовок, содержащий определение столбцов:
POS ID PosScore NegScore SynsetTerms Gloss
- POS "а" является частью речи (прилагательное)
- ID - это уникальный идентификатор леммы в Wordnet
- PosScore => Положительный балл
- NegScore => Отрицательный результат
- SynsetTerms => имена синетов Wordnet (#1 = первый смысл, #2 = второй смысл)
- Пояснительное предложение