IBM watson Retrieve и ошибка обучения ранга "java.util.ArrayList не может быть приведен к java.lang.Float"
Мы определили схему Solr в IBM Watson for Worksheet как набор вопросов. Есть несколько элементов схемы, которые являются многозначными полями. Мы можем загружать документы и индексировать документы с использованием сервисов получения и ранжирования, но при создании набора обучающих данных мы получаем ошибки преобразования типов данных.
схема
<field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false"/>
<field name="worksheet_number" type="watson_text_en" indexed="true" stored="true" />
<field name='question_number' type='int' indexed='true' stored='true' multiValued='true' />
<field name='question_type' type='watson_text_en' indexed='true' stored='true' multiValued='true' />
<field name='answer' type='watson_text_en' indexed='true' stored='true' multiValued='true' />
<field name='text' type='watson_text_en' indexed='true' stored='true' multiValued='true' />
Команда обучения с помощью train.py, которая выдает исключение curl -u "***********": "************" " https: //gateway.watsonplatform. сеть / извлечения-и ранг / API / v1 / / 3b140ax15 чинов-ранг 3108
К сожалению, исключение не дает никакой информации, в какое поле оно генерирует исключение.
Java.lang.ClassCastException: java.util.ArrayList cannot be cast to java.lang.Float
at com.ibm.watson.hector.plugins.ss.FCFeatureGeneratorComponent.toCSV(FCFeatureGeneratorComponent.java:677)
at com.ibm.watson.hector.plugins.ss.FCFeatureGeneratorComponent.process(FCFeatureGeneratorComponent.java:364)
at org.apache.solr.handler.component.SearchHandler.handleRequestBody(SearchHandler.java:272)
at org.apache.solr.handler.RequestHandlerBase.handleRequest(RequestHandlerBase.java:155)
at org.apache.solr.core.SolrCore.execute(SolrCore.java:2082)
at org.apache.solr.servlet.HttpSolrCall.execute(HttpSolrCall.java:651)
at org.apache.solr.servlet.HttpSolrCall.call(HttpSolrCall.java:458)
at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:229)
at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:184)
at org.eclipse.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1652)
at org.eclipse.jetty.servlet.ServletHandler.doHandle(ServletHandler.java:585)
at org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:143)
at org.eclipse.jetty.security.SecurityHandler.handle(SecurityHandler.java:577)
at org.eclipse.jetty.server.session.SessionHandler.doHandle(SessionHandler.java:223)
at org.eclipse.jetty.server.handler.ContextHandler.doHandle(ContextHandler.java:1127)
at org.eclipse.jetty.servlet.ServletHandler.doScope(ServletHandler.java:515)
at org.eclipse.jetty.server.session.SessionHandler.doScope(SessionHandler.java:185)
at org.eclipse.jetty.server.handler.ContextHandler.doScope(ContextHandler.java:1061)
at org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:141)
at org.eclipse.jetty.server.handler.ContextHandlerCollection.handle(ContextHandlerCollection.java:215)
at org.eclipse.jetty.server.handler.HandlerCollection.handle(HandlerCollection.java:110)
at org.eclipse.jetty.server.handler.HandlerWrapper.handle(HandlerWrapper.java:97)
at org.eclipse.jetty.server.Server.handle(Server.java:499)
at org.eclipse.jetty.server.HttpChannel.handle(HttpChannel.java:310)
at org.eclipse.jetty.server.HttpConnection.onFillable(HttpConnection.java:257)
at org.eclipse.jetty.io.AbstractConnection$2.run(AbstractConnection.java:540)
at org.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.java:635)
at org.eclipse.jetty.util.thread.QueuedThreadPool$3.run(QueuedThreadPool.java:555)
at java.lang.Thread.run(Thread.java:745)\n","code":500}}
Кажется, есть проблема с полями MultiValue, определенными в схеме и наборе данных для генерации обучения для него. Поля с несколькими значениями позволяют нам хранить несколько вопросов, текстов для заданного номера рабочего листа с любыми типами данных. Например, целое число для номера вопроса со значениями [1,2,3,4,5] в поле question_number.
При генерации набора обучающих данных Watson API выдает исключение с ошибкой преобразования типа данных "java.util.ArrayList не может быть приведен к java.lang.Float".
1 ответ
Эта проблема может быть вызвана наличием в данных многозначного поля с именем "оценка". Это может быть явно определенное поле в schema.xml или допустимое динамическое поле в некоторых документах. Не могли бы вы проверить, так ли это? Если это так, его нужно будет изменить на другое имя (например, "my_score"), потому что это будет конфликтовать с именем, жестко закодированным Solr для возврата результатов.