Riak SOLR через HTTP и диапазоны дат?

Может кто-нибудь сказать мне, что Riak ожидает от формата даты при использовании API SOLR через HTTP для поиска? У меня есть некоторые данные, которые проиндексированы. Поиск по шаблону подтверждает, что:

{
    "responseHeader": {
        "status": 0,
        "QTime": 13,
        "params": {
            "q": "*",
            "q.op": "or",
            "filter": "",
            "wt": "json"
        }
    },
    "response": {
        "numFound": 2,
        "start": 0,
        "maxScore": "0.00000e+0",
        "docs": [
            {
                "id": "09d1bf74-9cdc-4001-8797-fc5a4b9170b0",
                "index": "TestIndex",
                "fields": {
                    "Timestamp_dt": "2014-06-06T02:10:35.367Z"
                },
                "props": {}
            },
            {
                "id": "09d1bf74-9cdc-4001-8797-fc5a4b9170b0",
                "index": "TestIndex",
                "fields": {
                    "Timestamp_dt": "2014-06-08T02:10:35.367Z"
                },
                "props": {}
            }
        ]
    }
}

Я также подтвердил, что моя схема принимает _dt как datetime:

%% Field names ending in "_dt" are indexed as dates
        {dynamic_field, [
            {name, "*_dt"},
            {type, date},
            {analyzer_factory, {erlang, text_analyzers, noop_analyzer_factory}}
        ]},

Я пробовал несколько вариантов, включая эти:

/solr/TestIndex/select?wt=json&q=Timestamp_dt:[20140508000000%20TO%2020140608000000]
/solr/TestIndex/select?wt=json&q=Timestamp_dt:[20140508T000000Z TO 20140607T000000Z]
/solr/TestIndex/select?wt=json&q=Timestamp_dt:%5B2014-05-08T00%3A00%3A00.000Z%20TO%202014-06-07T00%3A00%3A00.000Z%5D

Я в тупике, и документы по диапазонам дат несколько не хватает.. Кто-нибудь заставил это работать? Я застрял, конвертируя в эпоху даты?

1 ответ

Поля даты используют анализатор noop, поэтому индексированный текст будет точно таким, каким вы его сохранили. Однако двоеточие является активным символом в запросе, поэтому вам нужно экранировать его в значении:

% curl localhost:8098/buckets/testbucket/keys/1 -XPUT -H "content-type: application/json" \
  -d '{"item":"1","stamp_dt":"2014-06-06T02:10:35.367Z"}'
% curl localhost:8098/buckets/testbucket/keys/2 -XPUT -H "content-type: application/json" \
  -d '{"item":"2","stamp_dt":"2014-06-07T02:10:35.367Z"}'
% curl localhost:8098/buckets/testbucket/keys/3 -XPUT -H "content-type: application/json" \
  -d '{"item":"3","stamp_dt":"2014-06-07T06:10:35.367Z"}'

% curl -g 'localhost:8098/solr/testbucket/select?q=stamp_dt:2014-06-06T02\:10\:35.367Z'
<?xml version="1.0" encoding="UTF-8"?>
<response>
  <lst name="responseHeader">
    <int name="status">0</int>
    <int name="QTime">1</int>
    <lst name="params">
      <str name="indent">on</str>
      <str name="start">0</str>
      <str name="q">stamp_dt:2014-06-06T02\:10\:35.367Z</str>
      <str name="q.op">or</str>
      <str name="filter"></str>
      <str name="df">value</str>
      <str name="wt">standard</str>
      <str name="version">1.1</str>
      <str name="rows">1</str>
    </lst>
  </lst>
  <result name="response" numFound="1" start="0" maxScore="0.353553">
    <doc>
      <str name="id">1
      </str>
      <str name="item">1
      </str>
      <date name="stamp_dt">2014-06-06T02:10:35.367Z
      </date>
    </doc>
  </result>
</response>

Выбранный вами формат даты также хорошо подходит для диапазона запросов (не уверен, почему пробелы должны быть явно URL-кодированы как%20):

% curl -g 'localhost:8098/solr/testbucket/select?q=stamp_dt:[2014-06-06%20TO%202014-06-07T23\:59]'
<?xml version="1.0" encoding="UTF-8"?>
<response>
  <lst name="responseHeader">
    <int name="status">0</int>
    <int name="QTime">4</int>
    <lst name="params">
      <str name="indent">on</str>
      <str name="start">0</str>
      <str name="q">stamp_dt:[2014-06-06 TO 2014-06-07T23\:59]</str>
      <str name="q.op">or</str>
      <str name="filter"></str>
      <str name="df">value</str>
      <str name="wt">standard</str>
      <str name="version">1.1</str>
      <str name="rows">3</str>
    </lst>
  </lst>
  <result name="response" numFound="3" start="0" maxScore="0.00000e+0">
    <doc>
      <str name="id">1
      </str>
      <str name="item">1
      </str>
      <date name="stamp_dt">2014-06-06T02:10:35.367Z
      </date>
    </doc>
    <doc>
      <str name="id">2
      </str>
      <str name="item">2
      </str>
      <date name="stamp_dt">2014-06-07T02:10:35.367Z
      </date>
    </doc>
    <doc>
      <str name="id">3
      </str>
      <str name="item">3
      </str>
      <date name="stamp_dt">2014-06-07T06:10:35.367Z
      </date>
    </doc>
  </result>
</response>
Другие вопросы по тегам