Как мне кодировать / декодировать HTML-объекты в Ruby?
Я пытаюсь декодировать некоторые объекты HTML, такие как '<'
становление '<'
,
У меня есть старый гем ( html_helpers), но, кажется, он был заброшен дважды.
Любые рекомендации? Мне нужно будет использовать его в модели.
8 ответов
HTMLEntities может сделать это:
: jmglov@laurana; sudo gem install htmlentities
Successfully installed htmlentities-4.2.4
: jmglov@laurana; irb
irb(main):001:0> require 'htmlentities'
=> []
irb(main):002:0> HTMLEntities.new.decode "¡I'm highly annoyed with character references!"
=> "¡I'm highly annoyed with character references!"
Для кодирования символов вы можете использовать CGI.escapeHTML
:
string = CGI.escapeHTML('test "escaping" <characters>')
Чтобы их расшифровать, есть CGI.unescapeHTML
:
CGI.unescapeHTML("test "unescaping" <characters>")
Конечно, перед этим необходимо включить библиотеку CGI:
require 'cgi'
И если вы в Rails, вам не нужно использовать CGI для кодирования строки. Там есть h
метод.
<%= h 'escaping <html>' %>
Я думаю, что камень Nokogiri также хороший выбор. Он очень стабилен и имеет огромное содействующее сообщество.
Образцы:
a = Nokogiri::HTML.parse "foo bär"
a.text
=> "foo bär"
или же
a = Nokogiri::HTML.parse "¡I'm highly annoyed with character references!"
a.text
=> "¡I'm highly annoyed with character references!"
Для декодирования символов в Rails используйте:
<%= raw '<html>' %>
Так,
<%= raw '<br>' %>
будет выводить
<br>
Если вы не хотите добавлять новую зависимость просто для этого (например, HTMLEntities
) и вы уже используете Hpricot
, он может и убежать, и убежать от вас. Это обрабатывает гораздо больше, чем CGI
:
Hpricot.uxs "foo bär"
=> "foo bär"
Ты можешь использовать htmlascii
перл:
Htmlascii.convert string
В Rails мы можем использовать:ERB::Util.html_escape
иERB::Util.url_encode
.
В представлениях они обозначаются какh
иu
http://ruby-doc.org/stdlib-1.9.3/libdoc/erb/rdoc/ERB/Util.html
<% str="<h1> Test </h1>" %>
result: < h1 > Test < /h1 >
<%= CGI.unescapeHTML(str).html_safe %>