Xapian фильтрация с пробелами

Как отфильтровать результат поиска по запросу с пробелами.

#include <iostream>
#include <string>
#include <xapian.h>
struct document{
    std::string title;
    std::string content;
    std::string url;
};

void indexData(document d) {
    try {
        Xapian::WritableDatabase db("/Users/ramesh/Desktop/xapian", Xapian::DB_CREATE_OR_OPEN);
        Xapian::TermGenerator indexer;
        Xapian::Stem stemmer("english");
        indexer.set_stemmer(stemmer);
        Xapian::Document doc;
        doc.set_data(d.title);
        indexer.set_document(doc);
        indexer.index_text(d.title,1,"title");
        indexer.index_text(d.content,1,"content");
        indexer.index_text(d.url,1,"url");
        doc.add_boolean_term("title"+d.title);
        db.replace_document(d.url,doc);
        db.commit();
    } catch (const Xapian::Error &e) {
        std::cout << e.get_description() << std::endl;
        exit(1);
    }
}

void searchData(std::string query_string){
    try{
        Xapian::Database db("/Users/ramesh/Desktop/xapian");
        Xapian::Enquire enquire(db);
        Xapian::QueryParser qp;
        Xapian::Stem stemmer("english");
        qp.set_default_op(Xapian::Query::OP_FILTER);
        qp.set_stemmer(stemmer);
        qp.add_prefix("","title");
        qp.add_prefix("","content");
        qp.add_boolean_prefix("title","title");
        qp.set_database(db);
        qp.set_stemming_strategy(Xapian::QueryParser::STEM_SOME);
        Xapian::Query query = qp.parse_query(query_string);
        std::cout << "Parsed query is: " << query.get_description() << std::endl;
        enquire.set_query(query);
        Xapian::MSet matches = enquire.get_mset(0, 10);
        std::cout << matches.get_matches_estimated() << " results found.\n";
        std::cout << "Matches 1-" << matches.size() << ":\n" << std::endl;
        for (Xapian::MSetIterator i = matches.begin(); i != matches.end(); ++i) {
            std::cout << i.get_rank() + 1 << ": " << i.get_weight() << " docid=" << *i
                 << " [" << i.get_document().get_data() << "]\n\n";
        }
    } catch (const Xapian::Error &e) {
        std::cout << e.get_description() << std::endl;
        exit(1);
    }

}

int main()
{
    document d1,d2;
    d1.title = "Xapain is good";
    d1.content = "Xapian is an open source search engine library, which allows developers to add advanced indexing and search facilities to their own applications.";
    d1.url = "http://www.xapian.org";
    d2.title = "Xapain is awesome";
    d2.content = "good Xapian is an open source search engine library, which allows developers to add advanced indexing and search facilities to their own applications.";
    d2.url = "http://www.xapian.org/test";
    indexData(d1);
    indexData(d2);
    searchData("xapian title:good");
    searchData("xapian title:Xapian is good");
    return 0;
}

Первый запрос "xapian title:good" работает хорошо.

Но "xapian title:Xapian is good" терпит неудачу.

Кто-нибудь может объяснить, в чем проблема

2 ответа

Вы определяете название как:

d1.title = "Xapain is good";

и ваш поисковый запрос:

searchData("xapian title:Xapian is good");

Может ли быть проблема в том, что вы просто неправильно набрали "Xapian" для "Xapain"?

В методе searchData() вы должны включить

document d;

qp.add_prefix(d.title,"title");
qp.add_prefix(d.content,"content");

вместо

qp.add_prefix("","title");
qp.add_prefix("","content");
Другие вопросы по тегам