InstaPaper API - /api/1/bookmarks/get_text

Question

InstaPaper API - /api/1/bookmarks/get_text

Я работаю с API InstaPaper

Я использую эту строку, чтобы вытащить содержание статьи.

$Bookmark_Text = $connection->getBookmarkText($Bookmark['bookmark_id']);

К сожалению, он тянет весь HTML и в основном помещает структуру HTML в мой HTML.

Пример.

<html>
<head></head>
<body>
    <html>
    <head>Instapaper Title</head>
    <body>InstaPaper Article Content</body>
    </html>
</body>
</html>

Любые мысли о том, как просто получить "контент статьи Instapaper"

Спасибо!

0

php api instapaper

Источник

user873269 19 май '12 в 00:12

2 ответа

Другие вопросы по тегам php api instapaper

user823012 27 авг '12 в 15:45 2012-08-27 15:45 · Answer 1 · 2012-08-27 15:45

Вот некоторый код JS, который извлекает только статью и удаляет материал Instapaper (например, верхняя и нижняя строка).

html.replace(/^[\s\S]*<div id="story">|<\/div>[^<]*<div class="bar bottom">[\s\S]*$/gim, '');

Имейте в виду, что это может измениться при изменении вывода HTML в Instapaper.

1

Источник

user823012 27 авг '12 в 15:45

user1399979 19 май '12 в 00:27 2012-05-19 00:27 · Answer 2 · 2012-05-19 00:27

Используйте парсер для извлечения содержимого <body>, В PHP есть некоторые встроенные, но есть и другие, которые могут быть проще в использовании.

Это должно сделать это, если $Bookmark_Text является действительным документом HTML.

$dom = new DOMDocument();
$dom->loadHTML($Bookmark_Text);
$body = $dom->getElementsByTagName('body')->item(0);
$content = $body->ownerDocument->saveHTML($body);