Lucene.Net FastVectorHighlighter с мелкозернистым китайским инструментом сегментации не работает

введите описание изображения здесь

ошибка:

System.ArgumentOutOfRangeException: Index and length must refer to a location within the string.
Parameter name: length
   at System.String.Substring(Int32 startIndex, Int32 length)
   at Lucene.Net.Search.VectorHighlight.BaseFragmentsBuilder.MakeFragment(StringBuilder buffer, Int32[] index, Field[] values, WeightedFragInfo fragInfo, String[] preTags, String[] postTags, IEncoder encoder) in C:\BuildAgent\work\b1b63ca15b99dddb\src\Lucene.Net.Highlighter\VectorHighlight\BaseFragmentsBuilder.cs:line 195
   at Lucene.Net.Search.VectorHighlight.BaseFragmentsBuilder.CreateFragments(IndexReader reader, Int32 docId, String fieldName, FieldFragList fieldFragList, Int32 maxNumFragments, String[] preTags, String[] postTags, IEncoder encoder) in C:\BuildAgent\work\b1b63ca15b99dddb\src\Lucene.Net.Highlighter\VectorHighlight\BaseFragmentsBuilder.cs:line 146
   at Lucene.Net.Search.VectorHighlight.BaseFragmentsBuilder.CreateFragments(IndexReader reader, Int32 docId, String fieldName, FieldFragList fieldFragList, Int32 maxNumFragments) in C:\BuildAgent\work\b1b63ca15b99dddb\src\Lucene.Net.Highlighter\VectorHighlight\BaseFragmentsBuilder.cs:line 99

это потому, что код ресурса:

  protected virtual string MakeFragment(StringBuilder buffer, int[] index, Field[] values, WeightedFragInfo fragInfo,
        string[] preTags, string[] postTags, IEncoder encoder)
    {
        StringBuilder fragment = new StringBuilder();
        int s = fragInfo.StartOffset;
        int[] modifiedStartOffset = { s };
        string src = GetFragmentSourceMSO(buffer, index, values, s, fragInfo.EndOffset, modifiedStartOffset);
        int srcIndex = 0;
        foreach (SubInfo subInfo in fragInfo.SubInfos)
        {
            foreach (Toffs to in subInfo.TermsOffsets)
            {
                fragment
                    .Append(encoder.EncodeText(src.Substring(srcIndex, (to.StartOffset - modifiedStartOffset[0]) - srcIndex)))
                    .Append(GetPreTag(preTags, subInfo.Seqnum))
                    .Append(encoder.EncodeText(src.Substring(to.StartOffset - modifiedStartOffset[0], (to.EndOffset - modifiedStartOffset[0]) - (to.StartOffset - modifiedStartOffset[0]))))
                    .Append(GetPostTag(postTags, subInfo.Seqnum));
                srcIndex = to.EndOffset - modifiedStartOffset[0];
            }
        }
        fragment.Append(encoder.EncodeText(src.Substring(srcIndex)));
        return fragment.ToString();
    }

выделение мелкозернистого причастия с этим кодом будет неправильным. Так как эта функция может потребовать, чтобы сегментация слов была непрерывной. Пока мелкозернистое причастие не является непрерывным. Я хочу спросить, как может FastVectorHighlighter выделить с мелкозернистым причастием.

0 ответов

Другие вопросы по тегам