Нумерация слов в индексном файле тезауруса

Я хотел бы знать, как составляются словари тезауруса. Какова связь между файлом.dat и файлом индекса.idx? Например, соответствующая запись из файла th_en_CA_v2.dat выглядит следующим образом...

ploy|2
(noun)|gambit|remark (generic term)|comment (generic term)
(noun)|gambit|stratagem|maneuver (generic term)|manoeuvre (generic term)|tactical maneuver (generic term)|tactical manoeuvre (generic term)

Соответствующая запись из файла th_en_CA_v2.idx

ploy|12626348

Что это за число (12626348) рядом со словом уловка?

1 ответ

Решение

Это байтовое смещение записи для ploy в .dat файл.

Другие вопросы по тегам