Как узнать, будут ли два смайлика отображаться как один смайлик?
Emoji состоит из 2 UnicodeScalars U+1F44D, U+1F3FC.
Как это можно идентифицировать как 1 "отображаемый" эмодзи, как он будет отображаться как таковой на iOS?
1 ответ
Обновление для Swift 4 (Xcode 9)
Начиная со Swift 4, "последовательность Emoji" обрабатывается как один кластер графем (в соответствии со стандартом Unicode 9):
let s = "ab❤️"
print(s.count) // 4
поэтому другие обходные пути больше не нужны.
(Старый ответ для Swift 3 и ранее:)
Возможный вариант - перечислить и посчитать "составленные последовательности символов" в строке:
let s = "ab❤️"
var count = 0
s.enumerateSubstringsInRange(s.startIndex..<s.endIndex,
options: .ByComposedCharacterSequences) {
(char, _, _, _) in
if let char = char {
count += 1
}
}
print(count) // 4
Другой вариант - найти диапазон составленных символьных последовательностей по заданному индексу:
let s = "❤️"
if s.rangeOfComposedCharacterSequenceAtIndex(s.startIndex) == s.characters.indices {
print("This is a single composed character")
}
Как String
методы расширения:
// Swift 2.2:
extension String {
var composedCharacterCount: Int {
var count = 0
enumerateSubstringsInRange(characters.indices, options: .ByComposedCharacterSequences) {
(_, _, _, _) in count += 1
}
return count
}
var isSingleComposedCharacter: Bool {
return rangeOfComposedCharacterSequenceAtIndex(startIndex) == characters.indices
}
}
// Swift 3:
extension String {
var composedCharacterCount: Int {
var count = 0
enumerateSubstrings(in: startIndex..<endIndex, options: .byComposedCharacterSequences) {
(_, _, _, _) in count += 1
}
return count
}
var isSingleComposedCharacter: Bool {
return rangeOfComposedCharacterSequence(at: startIndex) == startIndex..<endIndex
}
}
Примеры:
"".composedCharacterCount // 1
"".characters.count // 2
"❤️".composedCharacterCount // 1
"❤️".characters.count // 4
"".composedCharacterCount // 2
"".characters.count // 1
Как видите, количество символов Swift (кластеров расширенных графем) может быть больше или меньше количества составленных последовательностей символов.