Поддержка gem rchardet для ISO-8859-1 и Windows-1252
Я хотел бы знать, поддерживает ли rchardet кодирование для ISO-8859-1 и Windows-1252. Я видел документацию, но я не получил надлежащую информацию об этом.
1 ответ
Решение
Я не знал жемчужину chardet, но нашел ваш ответ после 5 минут чтения кода на https://github.com/jmhodges/rchardet.
- UTF-8 поддерживается различными тестерами, включая UniversalDetector и UTF8Prober
- ASCII - это подмножество UTF-8, Latin-1 и других. Это непосредственно обнаружено
UniversalProber
, - ISO-8859-1 (также известный как Latin-1) поддерживается Latin1Prober
- Windows-1252, которая очень похожа на Latin-1 (и это зависит от данных, которые нельзя дифференцировать) также поддерживается
Latin1Prober
,
Что касается вашего общего вопроса, вы должны привыкнуть читать код драгоценных камней, которые вы используете, а не документацию. Он не только помогает ему понять, что делает самоцвет, но также чрезвычайно помогает понять, как он это делает, что он делает хорошо, а что нет. Кроме того, чтение кода делает вас всегда лучшим программистом.