Поиск по всему атрибуту в структурированных данных карты страницы с помощью Google CSE для фильтрации
У меня проблемы с поиском данных на настроенной мной карте страницы. Карта страницы возвращается правильно, когда содержащая страница является результатом, но я могу искать только первые десять слов атрибута, как это:
<Attribute name="description">The smash is the most
explosive and aggressive stroke in Badminton. Elite athletes can
generate shuttlecock velocities of up to 370 km/h. To perform the
stroke, one must understand the biomechanics involved, from the body
positioning to the wrist flexion. </Attribute>
"Smash" (more:pagemap:document-description:smash
) совпадет и вернет страницу, но "бадминтон" не будет. Инструмент тестирования структурированных данных показывает, что каждый space
создает новую точку данных и ограничивает количество точек до десяти:
more:pagemap:document-description
more:pagemap:document-description:aggressive
more:pagemap:document-description:and
more:pagemap:document-description:explosive
more:pagemap:document-description:in
more:pagemap:document-description:is
more:pagemap:document-description:most
more:pagemap:document-description:smash
more:pagemap:document-description:stroke
more:pagemap:document-description:the
Мне нужно иметь возможность фильтровать более десяти слов в каждом атрибуте. Есть ли способ обойти этот предел или я собираюсь фильтровать неправильный путь?
1 ответ
Согласно Google вы получаете только десять токенов для каждого атрибута для фильтрации. Я не смог обойти это.
Чтобы быть более конкретным в отношении моей первоначальной проблемы, я хранил несколько путей к страницам врача на странице клиники, которые становились токенизированными на каждом /
, Я решил свою проблему с помощью поиска страницы клиники в ярлыке страницы врача, а не чтения страниц врача из результатов поиска на странице клиники. Я использовал повторяющиеся атрибуты, чтобы иметь возможность искать, как
//inside clinic-page
<Attribute name="doctor">path/to/doc1</Attribute>
<Attribute name="doctor">path/to/doc2</Attribute>
...
Но это не позволяет вам прочитать каждую страницу врача из результатов страницы клиники. Это случилось, чтобы работать в моем случае. Google определенно ограничивает свои токены до десяти для каждого атрибута.