Как конфертировать из html номера в символ?
Поискав некоторое время в интернете, я обнаружил, что существует множество онлайн-инструментов, которые позволяют преобразовывать символы в номера html, но не наоборот.
Я ищу инструмент / онлайн-инструмент / PHP-скрипт для преобразования из номера HTML обратно в символ
например:
& -> &
затем вернуться к
& -> &
Кто-нибудь знает об этом?
3 ответа
Вы можете сделать это в Java, используя:
import org.apache.commons.lang.StringEscapeUtils
и используя StringEscapeUtils.unescapeHtml(String str) method
например, вывод:
System.out.println(StringEscapeUtils.unescapeHtml("@"));
@
System.out.println(StringEscapeUtils.unescapeHtml("€"));
-
System.out.println(StringEscapeUtils.unescapeHtml("–"));
€
Катись самостоятельно;)
Для PHP: поиск Google нашел htmlentities и http://php.net/html-entity-decode/:
<?php
$orig = "I'll \"walk\" the <b>dog</b> now";
$a = htmlentities($orig);
$b = html_entity_decode($a);
echo $a; // I'll "walk" the <b>dog</b> now
echo $b; // I'll "walk" the <b>dog</b> now
// For users prior to PHP 4.3.0 you may do this:
function unhtmlentities($string)
{
// replace numeric entities
$string = preg_replace('~&#x([0-9a-f]+);~ei', 'chr(hexdec("\\1"))', $string);
$string = preg_replace('~&#([0-9]+);~e', 'chr("\\1")', $string);
// replace literal entities
$trans_tbl = get_html_translation_table(HTML_ENTITIES);
$trans_tbl = array_flip($trans_tbl);
return strtr($string, $trans_tbl);
}
$c = unhtmlentities($a);
echo $c; // I'll "walk" the <b>dog</b> now
?>
Для.NET вы можете написать что-то простое, использующее HTMLEncode или HTMLDecode. Например:
HTMLDecode
[Visual Basic]
Dim EncodedString As String = "This is a <Test String>."
Dim writer As New StringWriter
Server.HtmlDecode(EncodedString, writer)
Dim DecodedString As String = writer.ToString()
[C#]
String EncodedString = "This is a <Test String>.";
StringWriter writer = new StringWriter();
Server.HtmlDecode(EncodedString, writer);
String DecodedString = writer.ToString();
Я полагаю, что большинство этих чисел являются просто значениями ASCII или Unicode, поэтому все, что вам нужно сделать, это найти символ, связанный с этим значением. Для не-Unicode символов это может быть так просто, как (сценарий Python):
#!/usr/bin/python
import sys
# Iterate through all command line arguments
for entity in sys.argv:
# Extract just the digits from the string (discard the '&#' and the ';')
value = "".join([i for i in entity if i in "0123456789"])
# Get the character with that value
result = chr(value)
# Print the result
print result
Затем позвоните с помощью:
python myscript.py "&"
Это может быть легко переведено на php или что-то еще, что-то основанное на:
<?php
$str = "The string ends in ampersand: ";
$str .= chr(38); /* add an ampersand character at the end of $str */
/* Often this is more useful */
$str = sprintf("The string ends in ampersand: %c", 38);
?>
(взято отсюда, поскольку я не знаю php!). Конечно, для преобразования "&" в 38 потребуется модификация, но я оставлю это как упражнение для тех, кто знает php.