Точное слово полнотекстовый поиск postgresql

Postgresql полнотекстовый поиск соответствует близким словам, но я хочу найти точное слово в большой таблице содержимого (тысячи слов в сотнях тысяч строк). Мой поиск должен быть очень быстрым (менее секунды). Использование like или ilike означает замедление (с 200000 слов: более 5 секунд). У кого-нибудь есть вопрос, чтобы посоветовать мне?

1 ответ

Решение

Вы должны быть в состоянии решить вашу проблему с помощью полнотекстового поиска PostgreSQL, если вы используете simple словарь и создать соответствующий индекс GIN:

CREATE TABLE haystack (id serial PRIMARY KEY, string text NOT NULL);
INSERT INTO haystack (string) VALUES ('I am your servant');
INSERT INTO haystack (string) VALUES ('What use is a server without a client?');

CREATE INDEX haystack_fts_ind ON haystack USING gin (to_tsvector('simple', string));

Давайте отключим последовательное сканирование, чтобы индекс использовался, хотя пример таблицы слишком мал:

SET enable_seqscan=off;

Теперь найдены только точные совпадения, и не происходит никакого определения:

SELECT * FROM haystack
WHERE to_tsvector('simple', string) @@ to_tsquery('simple', 'servant');

 id |      string       
----+-------------------
  1 | I am your servant
(1 row)

Индекс можно использовать для ускорения запроса:

EXPLAIN (COSTS off) SELECT * FROM haystack
WHERE to_tsvector('simple', string) @@ to_tsquery('simple', 'servant');

                                        QUERY PLAN                                        
------------------------------------------------------------------------------------------
 Bitmap Heap Scan on haystack
   Recheck Cond: (to_tsvector('simple'::regconfig, string) @@ '''servant'''::tsquery)
   ->  Bitmap Index Scan on haystack_fts_ind
         Index Cond: (to_tsvector('simple'::regconfig, string) @@ '''servant'''::tsquery)
(4 rows)
Другие вопросы по тегам