Используйте функцию Solr Schemaless без автоматического добавления неизвестных полей в управляемую схему
У меня есть разные источники данных, которые загружают разные документы в Solr Sink. Теперь, если два источника данных отправляют одно и то же поле имени с разными типами данных (скажем, целое и двойное), индексация второго поля завершается неудачно, поскольку тип данных первого поля уже добавлен в управляемую схему.
Все, что мне нужно, это чтобы оба поля были проиндексированы должным образом, как они работали в версиях Solr 4.x.
Поскольку имена полей появляются во время выполнения, предложите решение, которое будет работать для меня. Я полагаю, что это требует изменения в solrconfig.xml, но не может найти необходимое.
1 ответ
Как ваш Solr был настроен на работу в 4.x? Вы все еще можете сделать это точно так же, как в Solr 6.
С другой стороны, функция без схемы будет определять отображение типов в первый раз, когда видит поле. У него нет возможности узнать, что будет в будущем. Вот почему все автоопределения многозначны.
Однако, если вы хотите иметь дело с тем, что конкретное отображение целого числа слишком узкое, вы можете изменить определение цепочки UpdateRequestProcessor, которая фактически выполняет сопоставление. Просто объедините отображение целого / длинного / числа в один последний тип tdoubles.