Как обновить метаданные с использованием индексов контента в контенте веб-центра

Мне нужно создать программу, которая может искать документ и заполнять метаданные из документа (например, резюме кандидата), такие как пользовательский опыт, навыки пользователя, местоположение и т. Д.

для этого мне нравится использовать механизм индексации Oracle (текстовый поиск Oracle), потому что он индексирует все данные из документа. когда он индексирует документ, я хотел бы сначала обновить поле метаданных из проиндексированных данных, а затем контент-сервер обновит их индексы. Может ли кто-нибудь помочь мне, как я узнаю работу индексатора и событие, на котором я буду ловить и внести некоторые изменения для обновления моих метаданных.

мне нужно обновить метаданные, потому что требования:

Широкий выбор критериев фильтра поиска (который ищет в резюме, а не только в ключевых словах): - булев поиск по нескольким параметрам; - поиск по навыкам, годам опыта, конкретной компании, квалификации образования, географическому положению / местоположению и дате отправки профиля. - Поиск того, кто ссылался, имя, команда, БУ и т. Д. - Окно результатов адекватного размера результатов, фильтры - Предопределенные критерии фильтра резюме для помощи в отборе кандидатов в случае подачи заявки на портал вакансий

2 ответа

Вы смотрите на эту проблему не с того конца. Индексатор (OracleText Search) является мощным и сложным инструментом, встроенным в работу базы данных. Что вы предлагаете, так это интерпретировать результаты индексации текста и использовать их в качестве метаданных для вашего контента - если я не ошибаюсь? OracleText генерирует огромные объемы данных и дословно "разбивает" документы. Для вас сделать значимые метаданные из этого было бы огромной задачей. Вместо этого вы должны смотреть на захват метаданных как можно ближе к источнику. Это можно сделать с помощью (если вы используете MS-OFFICE) Word vbScript, когда пользователь сохраняет данные в хранилище или файловую систему. Я считаю, что вы можете полностью манипулировать метаданными в документе во время сохранения. Вам, конечно, нужно будет установить пакет интеграции Oracle WebCenter Content Desktop.

Посмотрите на Oracle WebCenter Capture. WebCenter Capture может сканировать документ и позволяет автоматически метить метаданные на документе. WebCenter Capture интегрируется с WebCenter Content (WCC) и позволяет напрямую регистрировать отсканированные документы в WebCenter Content.

http://www.oracle.com/technetwork/middleware/webcenter/content/index-090596.html

Другие вопросы по тегам