Что обычно лучше всего использовать - StringComparison.OrdinalIgnoreCase или StringComparison.InvariantCultureIgnoreCase?

У меня есть такой код:

If key.Equals("search", StringComparison.OrdinalIgnoreCase) Then
    DoSomething()
End If

Меня не волнует дело. Должен ли я использовать OrdinalIgnoreCase, InvariantCultureIgnoreCase, или же CurrentCultureIgnoreCase?

6 ответов

Решение

Из MSDN " Новые рекомендации по использованию строк в Microsoft.NET 2.0"

Описание: Владельцам кода, ранее использовавшим InvariantCulture для сравнения, сортировки и сортировки строк, следует строго рассмотреть возможность использования нового набора перегрузок String в Microsoft .NET 2.0. В частности, данные, предназначенные для того, чтобы быть независимыми от культуры и не относящимися к языку, должны начинать указывать перегрузки, используя члены StringComparison.Ordinal или StringComparison.OrdinalIgnoreCase нового перечисления StringComparison. Они обеспечивают побайтовое сравнение, подобное strcmp, которое не только устраняет ошибки в лингвистической интерпретации по существу символических строк, но и обеспечивает лучшую производительность. (15 печатных страниц)

Все это зависит

Сравнивать юникодные строки сложно:

Реализация поиска и сравнения строк Unicode в программном обеспечении для обработки текста должна учитывать наличие эквивалентных кодовых точек. В отсутствие этой функции пользователи, ищущие определенную последовательность кодовых точек, не смогут найти другие визуально неразличимые глифы, которые имеют другое, но канонически эквивалентное представление кодовых точек.

см.: http://en.wikipedia.org/wiki/Unicode_equivalence


Если вы пытаетесь сравнить 2 строки в кодировке Юникод без учета регистра и хотите, чтобы они работали ВЕЗДЕ, у вас возникла невозможная проблема.

Классическим примером является турецкий i, который в верхнем регистре становится İ (обратите внимание на точку)

По умолчанию.Net Framework обычно использует CurrentCulture для функций, связанных со строками, за очень важным исключением .Equals который использует порядковое (побайтовое) сравнение.

Это приводит к тому, что различные строковые функции ведут себя по-разному в зависимости от культуры компьютера.


Тем не менее, иногда мы хотим "общего назначения", без учета регистра, сравнения.

Например, вы можете захотеть, чтобы сравнение строк велось одинаково, независимо от того, на каком компьютере установлено приложение.

Для этого у нас есть 3 варианта:

  1. Установите явную культуру и выполните сравнение без учета регистра, используя правила эквивалентности Юникода.
  2. Установите для культуры значение Инвариантная культура и выполняйте сравнение без учета регистра, используя правила эквивалентности Юникода.
  3. Используйте OrdinalIgnoreCase, который будет вводить строку в верхнем регистре с помощью InvariantCulture, а затем выполнять побайтовое сравнение.

Правила эквивалентности Юникода сложны, что означает, что использование метода 1) или 2) более затратно, чем OrdinalIgnoreCase, Дело в том, что OrdinalIgnoreCase не выполняет какой-либо специальной нормализации Юникода, это означает, что некоторые строки, которые отображаются одинаково на экране компьютера, не будут считаться идентичными. Например: "\u0061\u030a" а также "\u00e5" оба рендера. Однако в порядковом сравнении будет считаться другим.

То, что вы выберете, во многом зависит от приложения, которое вы создаете.

  • Если бы я писал бизнес-приложение, которое использовалось только турецкими пользователями, я бы обязательно использовал метод 1.
  • Если бы мне просто потребовалось простое "поддельное" сравнение без учета регистра, например, имя столбца в БД, которое обычно является английским, я бы, вероятно, использовал метод 3.

У Microsoft есть свои рекомендации с четкими рекомендациями. Тем не менее, очень важно понять понятие эквивалентности Юникода, прежде чем подходить к этим проблемам.

Также, пожалуйста, имейте в виду, что OrdinalIgnoreCase - это особый вид зверя, который выбирает и выбирает немного порядкового сравнения с некоторыми смешанными в лексикографических аспектах. Это может сбивать с толку.

MSDN дает довольно четкие рекомендации по этому поводу: http://msdn.microsoft.com/en-us/library/ms973919.aspx

Я думаю, это зависит от вашей ситуации. Поскольку порядковые сравнения на самом деле смотрят на числовые значения Unicode символов, они не будут лучшим выбором при сортировке по алфавиту. Однако для сравнения строк порядковый номер будет немного быстрее.

Это зависит от того, что вы хотите, хотя я бы избегал инвариантной культуры, если вы не уверены, что никогда не захотите локализовать код для других языков. Вместо этого используйте CurrentCulture.

Кроме того, OrdinalIgnoreCase должен учитывать числа, которые могут или не могут быть тем, что вы хотите.

Очень простой ответ: если вы не используете турецкий язык, вам не нужно использовать InvariantCulture.

Смотрите следующую ссылку:

В C# в чем разница между ToUpper() и ToUpperInvariant()?

Другие вопросы по тегам