Отчет обо всех проиндексированных PDF-файлах с URL и заголовком

У меня есть GSA, который индексирует около 15 000 документов. После использования GSA на нашем главном веб-сайте в течение некоторого времени мы поняли, что большое количество наших PDF-файлов названы неправильно.

Чтобы исправить ошибку, мы бы хотели получить от GSA список всех PDF-файлов с их URL и заголовком в результатах поиска.

Можно ли получить такой отчет от GSA?

2 ответа

Решение

Вы можете экспортировать все URL-адреса из GSA, а затем использовать текстовый редактор (или приложение для работы с электронными таблицами), чтобы просмотреть их. Если у вас большое количество URL-адресов, вам, возможно, придется сначала открыть их в текстовом редакторе и извлечь только строки с PDF-файлами в них.

Ваш вопрос включал заголовок, и ни один из ответов не помог. Это невозможно в GSA, но доступны другие методы. Самый простой способ возможен, если у вас есть доступ к месту, где хранятся PDF-файлы. затем с помощью программного обеспечения Nitro pdf он может массово перечислить заголовки и другие метаданные в pdf, а затем вы можете массово изменить их из файла xls. Я сделал это несколько лет назад, чтобы 500+ PDF-файлов и по цене это украсть. Я не работаю на Nitro и не имею никакой принадлежности. Просто нужно было выполнить задачу, и она это сделала. единственное, что он не может сделать, это переименовать файлы. Но GSA использует и отображает заголовок метаданных в формате PDF, так что это действительно самый важный заголовок, чтобы получить право.

Другие вопросы по тегам