Извлечение безымянного синонима через массивы суффиксов

Попытка реализовать данный алгоритм в python, который называется "Извлечение синонимов без грамматики через массивы суффиксов" в заданном запросе {q} и корпусе {A}.

http://www.r.dl.itc.u-tokyo.ac.jp/~mino/syno-airs2008-camera.pdf

Псевдо-код:

cands <- ''
while(cands != Φ){
  x = getFirst(cands);
  N = nextGrams(A, q.x);
  foreach(n in N){
    if (sc_bar(n) > sc_sub(getFirst(results))){
      cands <- cut(n,q);
      results <- cut(n,q);
    }
  } 
}

Запутался в:

  1. Cands <- '' означает инициализацию пустой строки?
  2. Что такое инициализированная строка 'results'?
  3. Пользовательская функция getFirst выдает первый ранжированный элемент из отсортированного списка. Как рассчитывался ранг?

От всей души спасибо заранее.

0 ответов

Другие вопросы по тегам