Как конфертировать из html номера в символ?

Поискав некоторое время в интернете, я обнаружил, что существует множество онлайн-инструментов, которые позволяют преобразовывать символы в номера html, но не наоборот.

Я ищу инструмент / онлайн-инструмент / PHP-скрипт для преобразования из номера HTML обратно в символ

например:

& -> &

затем вернуться к

& -> &

Кто-нибудь знает об этом?

3 ответа

Вы можете сделать это в Java, используя:

import org.apache.commons.lang.StringEscapeUtils

и используя StringEscapeUtils.unescapeHtml(String str) method

например, вывод:

System.out.println(StringEscapeUtils.unescapeHtml("@")); 
@
System.out.println(StringEscapeUtils.unescapeHtml("€"));
-
System.out.println(StringEscapeUtils.unescapeHtml("–"));
€

Катись самостоятельно;)

Для PHP: поиск Google нашел htmlentities и http://php.net/html-entity-decode/:

<?php
$orig = "I'll \"walk\" the <b>dog</b> now";

$a = htmlentities($orig);

$b = html_entity_decode($a);

echo $a; // I'll &quot;walk&quot; the &lt;b&gt;dog&lt;/b&gt; now

echo $b; // I'll "walk" the <b>dog</b> now


// For users prior to PHP 4.3.0 you may do this:
function unhtmlentities($string)
{
    // replace numeric entities
    $string = preg_replace('~&#x([0-9a-f]+);~ei', 'chr(hexdec("\\1"))', $string);
    $string = preg_replace('~&#([0-9]+);~e', 'chr("\\1")', $string);
    // replace literal entities
    $trans_tbl = get_html_translation_table(HTML_ENTITIES);
    $trans_tbl = array_flip($trans_tbl);
    return strtr($string, $trans_tbl);
}

$c = unhtmlentities($a);

echo $c; // I'll "walk" the <b>dog</b> now

?>

Для.NET вы можете написать что-то простое, использующее HTMLEncode или HTMLDecode. Например:

HTMLDecode

[Visual Basic]

Dim EncodedString As String = "This is a &ltTest String&gt."
Dim writer As New StringWriter
Server.HtmlDecode(EncodedString, writer)
Dim DecodedString As String = writer.ToString()

[C#]

String EncodedString = "This is a &ltTest String&gt.";
StringWriter writer = new StringWriter();
Server.HtmlDecode(EncodedString, writer);
String DecodedString = writer.ToString();

Я полагаю, что большинство этих чисел являются просто значениями ASCII или Unicode, поэтому все, что вам нужно сделать, это найти символ, связанный с этим значением. Для не-Unicode символов это может быть так просто, как (сценарий Python):

#!/usr/bin/python
import sys

# Iterate through all command line arguments
for entity in sys.argv:
    # Extract just the digits from the string (discard the '&#' and the ';')
    value = "".join([i for i in entity if i in "0123456789"])
    # Get the character with that value
    result = chr(value)
    # Print the result
    print result

Затем позвоните с помощью:

python myscript.py "&#38;"

Это может быть легко переведено на php или что-то еще, что-то основанное на:

<?php
$str = "The string ends in ampersand: ";
$str .= chr(38); /* add an ampersand character at the end of $str */

/* Often this is more useful */

$str = sprintf("The string ends in ampersand: %c", 38);
?>

(взято отсюда, поскольку я не знаю php!). Конечно, для преобразования "&" в 38 потребуется модификация, но я оставлю это как упражнение для тех, кто знает php.

Другие вопросы по тегам