Использование cTAKES для разбора клинических документов

Я пытаюсь понять, как запустить конвейер клинических документов из Java. У меня есть набор клинических документов в виде простых текстов. Я хочу разобрать эти документы и извлечь список того, что есть в документе doc_ID, есть CUI с частотой freq. Я провел несколько дней, устанавливая cTAKES и ища решение. Я сужу его до ClinicalPipelineWithUmls.java, где он получает тест и запускает SimplePipeline с описанием AnaylisisEngineDescription. Вот часть кода:

String documentText = "Text of document to test goes here, such as the following. No edema, some soreness, denies pain.";
InputStream inStream = InputStreamCollectionReader.convertToByteArrayInputStream(documentText);
CollectionReader collectionReader = InputStreamCollectionReader.getCollectionReader(inStream);
AnalysisEngineDescription pipelineIncludingUmlsDictionaries = AnalysisEngineFactory.createAnalysisEngineDescription(
            "desc/analysis_engine/AggregatePlaintextUMLSProcessor");
AnalysisEngineDescription xWriter = AnalysisEngineFactory.createPrimitiveDescription(
            XWriter.class,
            XWriter.PARAM_OUTPUT_DIRECTORY_NAME,
            AssertionConst.evalOutputDir,
            XWriter.PARAM_XML_SCHEME_NAME,
            XWriter.XMI,
            XWriter.PARAM_FILE_NAMER_CLASS_NAME,
            CtakesFileNamer.class.getName());
SimplePipeline.runPipeline(collectionReader, pipelineIncludingUmlsDictionaries, xWriter);
System.out.println("Done at " + new Date());

Проблема в том, что он не может найти "InputStreamCollectionReader". Я искал это, но безуспешно! Не могли бы вы дать мне подсказку или показать некоторые направления? спасибо за любую помощь!

2 ответа

Есть ли какая-то конкретная причина, почему вы хотите использовать InputStreamCollectionReader? В противном случае, здесь есть примеры использования TextReader.

Мы внедрили сервис REST для cTAKES, который позволяет нам отправлять клинический текст в качестве запроса и возвращать проанализированный вывод в виде ответа JSON.

Вы можете взглянуть на модуль cTAKES REST в следующем репозитории github. Я чувствую, что это должен быть путь для пользователей cTAKES, которые заинтересованы в веб-доступе.

Другие вопросы по тегам