Извлечение безымянного синонима через массивы суффиксов
Попытка реализовать данный алгоритм в python, который называется "Извлечение синонимов без грамматики через массивы суффиксов" в заданном запросе {q} и корпусе {A}.
http://www.r.dl.itc.u-tokyo.ac.jp/~mino/syno-airs2008-camera.pdf
Псевдо-код:
cands <- ''
while(cands != Φ){
x = getFirst(cands);
N = nextGrams(A, q.x);
foreach(n in N){
if (sc_bar(n) > sc_sub(getFirst(results))){
cands <- cut(n,q);
results <- cut(n,q);
}
}
}
Запутался в:
- Cands <- '' означает инициализацию пустой строки?
- Что такое инициализированная строка 'results'?
- Пользовательская функция getFirst выдает первый ранжированный элемент из отсортированного списка. Как рассчитывался ранг?
От всей души спасибо заранее.