Строки, которые сравнивают равные, не находят одинаковые объекты в Hash

У меня есть две строки, которые кажутся равными:

context = "Marriott International World’s Most ADMIRED Lodging Company by FORTUNE for 14th yr. via @FortuneMagazine http://cnnmon.ie/1kcFZSQ"
slice_str = context.slice(105,24) # => "http://cnnmon.ie/1kcFZSQ"
str = "http://cnnmon.ie/1kcFZSQ"

slice_str == str                  # => true
slice_str.eql? str                # => true

Но когда я смотрю значения в хэше, где ключами являются строки, они не возвращают одно и то же в Ruby 2.1.0 и Ruby 2.1.1:

redirects = {"http://cnnmon.ie/1kcFZSQ"=>""}
redirects.key?(slice_str)         # => false
redirects.key?(str)               # => true

Какое объяснение этому поведению? Ruby 1.9.3 работает как положено.

2 ответа

Решение

Это была ошибка в ruby ​​< 2.1.3

$ rvm use 2.1.2
Using /Users/richniles/.rvm/gems/ruby-2.1.2
$ irb
2.1.2 :001 > context = "Marriott International World’s Most ADMIRED Lodging Company by FORTUNE for 14th yr. via @FortuneMagazine http://cnnmon.ie/1kcFZSQ"
 => "Marriott International World’s Most ADMIRED Lodging Company by FORTUNE for 14th yr. via @FortuneMagazine http://cnnmon.ie/1kcFZSQ" 
2.1.2 :002 > slice_str = context.slice(105,24) # => "http://cnnmon.ie/1kcFZSQ"
 => "http://cnnmon.ie/1kcFZSQ" 
2.1.2 :003 > str = "http://cnnmon.ie/1kcFZSQ"
 => "http://cnnmon.ie/1kcFZSQ" 
2.1.2 :004 > redirects = {"http://cnnmon.ie/1kcFZSQ"=>""}
 => {"http://cnnmon.ie/1kcFZSQ"=>""} 
2.1.2 :005 > redirects.key?(slice_str) 
 => false 
2.1.2 :006 > redirects.key?(str)  
 => true 

но сделайте то же самое в ruby ​​2.1.3:

 $ rvm use 2.1.3
 Using /Users/richniles/.rvm/gems/ruby-2.1.3
 $ irb
 2.1.3 :001 > context = "Marriott International World’s Most ADMIRED Lodging Company by FORTUNE for 14th yr. via @FortuneMagazine http://cnnmon.ie/1kcFZSQ"
  => "Marriott International World’s Most ADMIRED Lodging Company by FORTUNE for 14th yr. via @FortuneMagazine http://cnnmon.ie/1kcFZSQ" 
 2.1.3 :002 > slice_str = context.slice(105,24) # => "http://cnnmon.ie/1kcFZSQ"
  => "http://cnnmon.ie/1kcFZSQ" 
 2.1.3 :003 > str = "http://cnnmon.ie/1kcFZSQ"
  => "http://cnnmon.ie/1kcFZSQ" 
 2.1.3 :004 > redirects = {"http://cnnmon.ie/1kcFZSQ"=>""}
  => {"http://cnnmon.ie/1kcFZSQ"=>""} 
 2.1.3 :005 > redirects.key?(slice_str) 
  => true 
 2.1.3 :006 > redirects.key?(str)  
  => true 

За Hash ключи, его key#hash Метод определяет, считаются ли ключи равными или нет.

В ruby ​​2.1.1 для вашего примера эти два строковых хэша различны:

slice_str.hash == str.hash # => false in Ruby 2.1.1

Хотя мне совершенно непонятно, почему нарезанная строка имеет другой хэш. Даже более странно - я нашел, если вы тестируете код на ASCII-только строке (ваша строка, но с ' вместо ) - хэши будут одинаковыми!

Это действительно странно.

Единственное решение, которое я нашел (хотя это не выглядит элегантно):

slice_str = context.slice(105,24).chars.join # split it into separate chars and then join back
p str.hash == slice_str.hash # true now
p redirects.key?(slice_str) # true now

UPD: Упс, я не видел ссылку на ошибку в комментариях выше:(

Другие вопросы по тегам