Как использовать Snoopy класс в PHP?
Я новичок в php, я делаю простую программу, которая использует какой-то сканирующий веб-сайт (не личную информацию). Результатом, который я ожидал, является HTML-код, как
<html><head><title>blabla blabla</title></head>...................
Но я проверил результат, экран появился. не сырой код, например,
include "Snoopy.class.php";
$snoopy = new Snoopy;
$snoopy->fetch("http://stackru.com/");
echo $snoopy->results;
Как получить информацию в HTML-код? И у вас есть еще одна хорошая библиотека для разбора в PHP? (например, Beautifulsoup на Python и Jsoup на Java)
** Результат приведенного выше кода: не HTML-код, а экран **
3 ответа
Чтобы увидеть исходный код, использующий ваш браузер вместо того, чтобы отображать HTML, ваша последняя строка должна быть:
echo htmlspecialchars($snoopy->results);
Это очень просто
// Add snoopy class and initiate it
require "snoopy/Snoopy.class.php";
$snoopy = new Snoopy;
// THis fetches the html
$snoopy->fetch("http://www.php.net/");
$text = $snoopy->results;
// This fetches the text with html tags stripped
$snoopy->fetchtext("http://www.php.net/");
$text = $snoopy->results;
// This fetches all the links
$snoopy->fetchlinks('http://www.php.net/');
$linksarray = $snoopy->results;
Снупи отлично работает для меня. Надеюсь, это поможет
Если вы хотите извлечь html из URL, вы можете сделать это просто с помощью функции file_get_contents в php.
$url = 'http://stackru.com/';
$html = file_get_contents($url);
echo $url;