Как выбрать <dei: DocumentType из XBRL с помощью Cheerio (или

Question

Как выбрать <dei: DocumentType из XBRL с помощью Cheerio (или

Я пытаюсь получить текст (в данном случае это "10-Q") записи из XBRL, используя cheerio.js с nodejs. Строка ниже:

<dei:DocumentType contextRef="D2013Q3YTD" id="Fact-DB2A50C2A485F9CC21D51934C6E61D42">10-Q</dei:DocumentType>

Я пробовал:

$('dei:DocumentType').text

и несколько других безрезультатно. Я не вижу уникального идентификатора или чего-то еще.

Образец файла:

http://www.sec.gov/Archives/edgar/data/1018724/000144530513002495/amzn-20130930.xml

Так как же я могу извлечь этот текст? Благодарю.

2

parsing cheerio xbrl

Источник

user464273 22 дек '13 в 17:13

2 ответа

Решение

XBRL - это XML, и его нельзя рассматривать как HTML DOM с такими библиотеками, как cheerio. Вам понадобится парсер XML с поддержкой Xpath, такой как xpath, libxml или o3-xml

Затем вы можете получить значение с помощью выражения XPath, например:

/*/dei:DocumentType/text()

-1

Источник

user2371714 07 янв '14 в 19:39

Другие вопросы по тегам parsing cheerio xbrl

user464273 11 апр '14 в 22:12 2014-04-11 22:12 · Accepted Answer · 2014-04-11 22:12

Оказывается, что разбор файла выше очень возможен с Cheerio.

Это работает с помощью Cheerio:

$('dei\\:CurrentFiscalYearEndDate').text().trim();

Нужно избегать специальных символов, дважды, очевидно.

5

Источник

user464273 11 апр '14 в 22:12