Как найти ключевое слово в URL из источника HTML, но сохранить ссылку и текст привязки в массиве
Немного застрял на этом, то, что я хочу сделать, это зациклить список URL'ов, которые содержат ссылки на мой сайт, я пытаюсь захватить HTML-код, используемый для создания ссылки и, в качестве альтернативы, сохранить текст привязки, который используется как ссылка,
[код удален Марти, см. ниже]
так что код, используемый для ссылок martylinks, использует функцию, которую я до сих пор пытаюсь создать, у меня есть небольшие проблемы, но для вас, ребята, я уверен, что это действительно просто...
это моя функция find_marty_links
function find_marty_links($file, $keyword){
//1: Find link to my site <a href="http://www.***martin***-gardner.co.uk" target="_blank" title="Web Developer">Web Developer</a>
//2: copy the FULL HTML LINK to array
//3: copy the REL value? NOFOLLOW : FOLLOW to array
//4 copy TITLE (if any) to array
//5 copy Anchor Text to array
$htmlDoc = new DomDocument();
$htmlDoc->loadhtml($file);
$output_array = array();
foreach($htmlDoc->getElementsByTagName('a') as $link) {
// STEP 1
// SEARCH ENTIRE PAGE FOR KEYWORD?
// FIND A LINK WITH MY KEYWORD?
preg_match_all('???', $link, $output); //???//
if(strpos($output) == $keyword){
// STEP 2
// COPY THE FULL HTML FOR THAT LINK?
$full_html_link = preg_match(??);
$output_array['link_html'] = $full_html_link;
// STEP 3
// COPY THE REL VALUE TO ARRAY
$link_rel = $link->getAttribute('rel');
$output_array['link_rel'] = $link_rel;
// STEP 4
// COPY TITLE TO ARRAY
$link_title = $link->getAttribute('title');
$output_array['link_title'] = $link_title;
// STEP 5
// COPY ANCHOR TEXT TO ARRAY
$anchor_exp = expode('>'); //???
$anchor_txt = $anchor_exp[2];//??
$output_array['link_anchor'] = $anchor_txt;
}
}
}
!!ОБНОВИТЬ!! нужно создать массив, как показано ниже
$results = array('link_html' => '<a title="test" href="http://site.com" rel="nofollow">anchor text</a>',
'link_rel' => 'nofollow',
'link_title' => 'test',
'link_anchor' => 'anchor text'
)
спасибо за любую помощь, ребята..
M
1 ответ
Решение
Хорошо, вот обновленный код:
function find_marty_links($file, $keyword){
$htmlDoc = new DomDocument();
$htmlDoc->loadhtml($file);
$links = array();
foreach($htmlDoc->getElementsByTagName('a') as $link) {
$url = $link->getAttribute('href');
$title = $link->getAttribute('title');
$text = $link->nodeValue;
$rel = $link->getAttribute('rel');
if(strpos($url,$keyword) !== false || strpos($title,$keyword) !== false || strpos($text,$keyword) !== false)
{
$links[] = array('url' => $url, 'text' => $text, 'title' => $title, 'rel' => $rel);
}
}
return $links;
}