Поддержка gem rchardet для ISO-8859-1 и Windows-1252

Я хотел бы знать, поддерживает ли rchardet кодирование для ISO-8859-1 и Windows-1252. Я видел документацию, но я не получил надлежащую информацию об этом.

1 ответ

Решение

Я не знал жемчужину chardet, но нашел ваш ответ после 5 минут чтения кода на https://github.com/jmhodges/rchardet.

  • UTF-8 поддерживается различными тестерами, включая UniversalDetector и UTF8Prober
  • ASCII - это подмножество UTF-8, Latin-1 и других. Это непосредственно обнаружено UniversalProber,
  • ISO-8859-1 (также известный как Latin-1) поддерживается Latin1Prober
  • Windows-1252, которая очень похожа на Latin-1 (и это зависит от данных, которые нельзя дифференцировать) также поддерживается Latin1Prober,

Что касается вашего общего вопроса, вы должны привыкнуть читать код драгоценных камней, которые вы используете, а не документацию. Он не только помогает ему понять, что делает самоцвет, но также чрезвычайно помогает понять, как он это делает, что он делает хорошо, а что нет. Кроме того, чтение кода делает вас всегда лучшим программистом.

Другие вопросы по тегам