Как имитировать поведение Auto-Link при переполнении стека
С PHP, как я могу имитировать поведение автоматического связывания переполнения стека (что BTW удивительно круто)?
Например, следующий URL:
/questions/1959367/kak-imitirovat-povedenie-auto-link-pri-perepolnenii-steka
Превращается в это:
<a title="how to mimic stackru auto link behavior" rel="nofollow" href="http://www.stackru.com/questions/1925455/how-to-mimic-stackru-auto-link-behavior">stackru.com/questions/1925455/…</a>
Я действительно не забочусь о title
атрибут в этом случае.
И это:
Превращается в это:
<a rel="nofollow" href="http://pt.php.net/manual/en/function.base-convert.php#52450">pt.php.net/manual/en/…</a>
Как я могу сделать аналогичную функцию в PHP?
PS: Проверьте мои комментарии по этому вопросу, чтобы найти еще несколько примеров и поведений.
6 ответов
Попробуйте это. Шаблон регулярного выражения, соответствующий URL, взят из Daring Fireball.
/**
* Replace links in text with html links
*
* @param string $text
* @return string
*/
function auto_link_text($text)
{
// a more readably-formatted version of the pattern is on http://daringfireball.net/2010/07/improved_regex_for_matching_urls
$pattern = '(?i)\b((?:[a-z][\w-]+:(?:/{1,3}|[a-z0-9%])|www\d{0,3}[.]|[a-z0-9.\-]+[.][a-z]{2,4}/)(?:[^\s()<>]+|\(([^\s()<>]+|(\([^\s()<>]+\)))*\))+(?:\(([^\s()<>]+|(\([^\s()<>]+\)))*\)|[^\s`!()\[\]{};:\'".,<>?«»“”‘’]))';
$callback = create_function('$matches', '
$url = array_shift($matches);
$url_parts = parse_url($url);
$text = parse_url($url, PHP_URL_HOST) . parse_url($url, PHP_URL_PATH);
$text = preg_replace("/^www./", "", $text);
$last = -(strlen(strrchr($text, "/"))) + 1;
if ($last < 0) {
$text = substr($text, 0, $last) . "…";
}
return sprintf(\'<a rel="nofollow" href="%s">%s</a>\', $url, $text);
');
return preg_replace_callback($pattern, $callback, $text);
}
Введите текст:
This is my text. I wonder if you know about asking questions on Stackru:
Check This out http://www.stackru.com/questions/1925455/how-to-mimic-stackru-auto-link-behavior
Also, base_convert php function?
http://pt.php.net/manual/en/function.base-convert.php#52450
http://pt.php.net/manual/en/function.base-convert.php?wtf=hehe#52450
Выходной текст:
This is my text. I wonder if you know about asking questions on Stackru:
Check This out <a rel="nofollow" href="http://www.stackru.com/questions/1925455/how-to-mimic-stackru-auto-link-behavior">stackru.com/questions/1925455/…</a>
Also, base_convert php function?
<a rel="nofollow" href="http://pt.php.net/manual/en/function.base-convert.php#52450">pt.php.net/manual/en/…</a>
<a rel="nofollow" href="http://pt.php.net/manual/en/function.base-convert.php?wtf=hehe#52450">pt.php.net/manual/en/…</a>
Это основано на том же регулярном выражении daringfireball.net, но добавляет немного больше логики, чем в примере Эрика Колемана, а также конфигурации для максимальной глубины URL (SO, кажется, 50), максимальной глубины пути при усечении URL (SO, кажется, быть 2), и многоточие характера (…
).
Насколько я знаю, это копирует все функциональные возможности перезаписи URL-адресов, по крайней мере, насколько это обсуждалось в комментариях и ответах здесь.
function auto_link_text($text) {
$pattern = '#\b(([\w-]+://?|www[.])[^\s()<>]+(?:\([\w\d]+\)|([^[:punct:]\s]|/)))#';
return preg_replace_callback($pattern, 'auto_link_text_callback', $text);
}
function auto_link_text_callback($matches) {
$max_url_length = 50;
$max_depth_if_over_length = 2;
$ellipsis = '…';
$url_full = $matches[0];
$url_short = '';
if (strlen($url_full) > $max_url_length) {
$parts = parse_url($url_full);
$url_short = $parts['scheme'] . '://' . preg_replace('/^www\./', '', $parts['host']) . '/';
$path_components = explode('/', trim($parts['path'], '/'));
foreach ($path_components as $dir) {
$url_string_components[] = $dir . '/';
}
if (!empty($parts['query'])) {
$url_string_components[] = '?' . $parts['query'];
}
if (!empty($parts['fragment'])) {
$url_string_components[] = '#' . $parts['fragment'];
}
for ($k = 0; $k < count($url_string_components); $k++) {
$curr_component = $url_string_components[$k];
if ($k >= $max_depth_if_over_length || strlen($url_short) + strlen($curr_component) > $max_url_length) {
if ($k == 0 && strlen($url_short) < $max_url_length) {
// Always show a portion of first directory
$url_short .= substr($curr_component, 0, $max_url_length - strlen($url_short));
}
$url_short .= $ellipsis;
break;
}
$url_short .= $curr_component;
}
} else {
$url_short = $url_full;
}
return "<a rel=\"nofollow\" href=\"$url_full\">$url_short</a>";
}
Пример ввода:
This is my text. I wonder if you know about asking questions on Stackru:
Check This out http://www.stackru.com/questions/1925455/how-to-mimic-stackru-auto-link-behavior
Also, base_convert php function?
http://pt.php.net/manual/en/function.base-convert.php#52450
http://pt.php.net/manual/en/function.base-convert.php?wtf=hehe#52450
http://a.b/c/d/e/f/test
and http://a.b/c/d/e/f/g/h/i/j/k/l/m/n/o/p/q/r/s/t/u/v/z/y/w/z/test
Пример вывода:
This is my text. I wonder if you know about asking questions on Stackru:
Check This out <a rel="nofollow" href="http://www.stackru.com/questions/1925455/how-to-mimic-stackru-auto-link-behavior">http://stackru.com/questions/1925455/…</a>
Also, base_convert php function?
<a rel="nofollow" href="http://pt.php.net/manual/en/function.base-convert.php#52450">http://pt.php.net/manual/en/…</a>
<a rel="nofollow" href="http://pt.php.net/manual/en/function.base-convert.php?wtf=hehe#52450">http://pt.php.net/manual/en/…</a>
<a rel="nofollow" href="http://a.b/c/d/e/f/test">http://a.b/c/d/e/f/test</a>
and <a rel="nofollow" href="http://a.b/c/d/e/f/g/h/i/j/k/l/m/n/o/p/q/r/s/t/u/v/z/y/w/z/test">http://a.b/c/d/…</a>
Это преобразует образец строки в то, что вы после. Я не учел title
так как это исходит из другого источника, чем просто отдельный URL, и вы сказали, что это не важно.
<?php
$urlInput="http://www.stackru.com/questions/1925455/how-to-mimic-stackru-auto-link-behavior";
preg_match('@http://(?:www\.)?(\S+/)\S*(?:\s|$)@i', $urlInput, $matches);
print('<a rel="nofollow" href="' . trim($matches[0]) . '">' . $matches[1] . '...</a>');
?>
Расширьте при необходимости, чтобы просмотреть текст.
Если вы хотите сопоставить только определенное количество элементов пути URL, используйте этот RE:
'@http://(?:www\.)?((?:\S+?/){1,3})\S*(?:\s|$)@i'
Это позволит извлечь до 3 элементов пути (хост и до двух каталогов). Вы можете изменить верхнюю границу в {1,3}
определить максимальное количество элементов пути, которое вы хотите.
Поменял концовку \S
чтобы учесть ноль совпадений.
Если у вас есть предсказуемый URL-адрес, такой как SO, тогда будет легко получить ссылки с регулярным выражением и отфильтровать те, которые соответствуют шаблону. Так что, если ваш URL http://example.com/stuff/1234
затем найти http://example.com/stuff/1234/how-to-mimic
было бы довольно тривиально с регулярным выражением.
<?php
preg_match('/http:\/\/example.com\/(\w*)\/(\d)[\/*]/', $text, $matches);
if (is_array($matches))
{
foreach ($matches as $match)
{
// do something...
}
}
?>
Отчасти основано на ответе Кевина Брока, но позволяет настраивать параметры (глубина папки и длина URL-адреса) и принимает URL-адреса без конечных слешей:
$url = 'http://www.stackru.com/questions/1925455/how-to-mimic-stackru-auto-link-behavior';
$output = '';
$params = array (
'length' => 10,
'depth' => 2,
);
preg_match ('@http://(?:www\.)?([^/?# ]+)(/\S+)?(?=\s|$)@i', $url, $matches);
if (isset ($matches[2]))
{
$parts = explode('/', substr($matches[2], 1));
if (count($parts) > $params['depth'] && strlen($matches[1].$matches[2]) > $params['length'])
$output = $matches[1].'/'.implode('/', array_slice($parts, 0, 2)).'/...';
else
$output = $matches[1].$matches[2];
}
else
$output = $matches[1];
echo '<a href="'.$matches[0].'">'.$output.'</a>';
Надеюсь это поможет
Смотрите Regex (регулярное выражение), чтобы соответствовать URL:
https?://([-\w\.]+)+(:\d+)?(/([\w/_\.]*(\?\S+)?)?)?
Пример PHP: автоматически связывать URL-адреса внутри текста.
$text = preg_replace('@(https?://([-\w\.]+)+(:\d+)?(/([\w/_\.]*(\?\S+)?)?)?)@', '<a href="$1">$1</a>', $text);