Как выполнять фильтрацию префиксов в нижнем регистре с помощью Stratio Cassandra Lucene Index

Можно ли выполнять фильтрацию / запросы префиксов в нижнем регистре с помощью Stratio Cassandra Lucene Index? Я не смог найти документацию по этому конкретному случаю использования.

1 ответ

Решение

Расстановка запросов зависит от того, как труд анализатора текста Lucene используется во время индексации, и не может быть решена во время запроса. Если вы хотите выполнять поиск префиксов без учета регистра, вам следует использовать маппер с анализатором, который выдает термины в нижнем регистре. Эти термины будут проиндексированы и сопоставлены во время поиска. Например:

CREATE KEYSPACE test
WITH REPLICATION = {'class' : 'SimpleStrategy', 'replication_factor': 1};
USE test;
CREATE TABLE test (
    id INT PRIMARY KEY,
    body TEXT
);

CREATE CUSTOM INDEX test_index ON test ()
USING 'com.stratio.cassandra.lucene.Index'
WITH OPTIONS = {
    'refresh_seconds' : '1',
    'schema' : '{
        fields : {
            body1 : {type :"string", column:"body", case_sensitive:false},
            body2 : {type :"string", column:"body", case_sensitive:true}
        }
    }'
};

INSERT INTO test(id,body) VALUES ( 1, 'foo');
INSERT INTO test(id,body) VALUES ( 2, 'Foo');
INSERT INTO test(id,body) VALUES ( 3, 'bar');
INSERT INTO test(id,body) VALUES ( 4, 'Bar');


SELECT * FROM test WHERE expr(test_index, 
   '{filter:{type:"prefix", field:"body2", value:"f"}}'); -- Returns foo
SELECT * FROM test WHERE expr(test_index, 
   '{filter:{type:"prefix", field:"body2", value:"F"}}'); -- Returns Foo

SELECT * FROM test WHERE expr(test_index, 
   '{filter:{type:"prefix", field:"body1", value:"f"}}'); -- Returns foo and Foo
SELECT * FROM test WHERE expr(test_index, 
   '{filter:{type:"prefix", field:"body1", value:"F"}}'); -- Returns no results
Другие вопросы по тегам