Как убрать неправильное вложение тегов BBcode с помощью PHP
По некоторым причинам я получил следующий неправильно вложенный BBcode
[url =] Привет [url =] мир [/ url] [/ url]
Я просто хочу удалить вложенные теги URL. Результат должен быть: [url=] Hello world [/url]
У меня очень длинная статья, и это случается много раз. Есть предложения для этого?
Как удалить вложенные теги много раз в одной статье, как это
[url =] Привет [url =] мир [/ url] [/ url] [url =] Привет [url =] мир [/ url] [/ url] [url =] Привет [url =] мир [/ url] [/ URL]
Спасибо!
2 ответа
Следующий проверенный скрипт должен сделать свое дело. Он использует рекурсивное регулярное выражение и рекурсивное применение preg_replace_callback()
, Он будет обрабатывать теги URL на любом вложенном уровне и удаляет все теги, кроме самых внешних:
<?php // test.php 20110325_1500
$re_url = '%# Match outermost [URL=...]...[/URL] (may have nested URL tags
(\[URL\b[^[\]]*+\]) # $1: opening URL tag.
( # $2: Contents of URL tag.
(?: # Group of contents alternatives.
(?:(?!\[/?URL\b).)++ # One or more non-"[URL", non-"[/URL"
| (?R) # Or recursively match nested [URL]..[/URL].
)*+ # Zero or more contents alternatives.
) # End $2: Contents of URL tag.
(\[/URL\s*+\]) # $3: Outermost closing [/URL]
%six';
function strip_nested_url_tags($text) {
global $re_url;
$return = '_handle_url_callback';
return preg_replace_callback($re_url, $return, $text);
}
function _handle_url_callback($matches) {
global $re_url;
static $depth = 0;
$depth++;
$return = '_handle_url_callback';
$matches[2] = preg_replace_callback($re_url, $return, $matches[2]);
if ($matches[2] === NULL)
{ // On error, preg_replace_callback returns NULL.
exit('Error - Message is too long or too complex.');
}
if (--$depth > 0) return $matches[2];
return $matches[1] . $matches[2] . $matches[3];
}
$data = file_get_contents('testdata.html');
$data = strip_nested_url_tags($data);
file_put_contents('testdata_out.html', $data);
?>
Это может сработать:
$string = preg_replace("/(\[url=[^\]]*\].*)\[url=[^\]]*\](.*)\[\/url\](.*\[\/url\])/is", "$1$2$3", $string);
Вы должны найти корень проблемы, а не пытаться ее устранить.