Как преобразовать текст в формате Unicode UCS-2 для чтения с C#?
Я получаю это сообщение в SMS-сообщении в SIM900 GPRS.
07916698019021F00410D05479BDDC7CBBCB790008217002123430826A0049006E0063006F00720072006500630074002000700061007300730077006F00720064002E00200050006C050610306500065060740507202079060750702007001070730700F0700402001060010600E02
И еще один пример сообщения:
07916698019021F00410D05479BDDC7CBBCB790008217002025501826A0049006E0063006F00720072006500630074002000700061007300730077006F00720064002E00200050006C06001073050200506E04065070200906F07072020700607307007060020600006007060090600E
Я думаю, что это сообщение в формате Unicode UCS-2 и на тайском языке. Однако я не могу преобразовать это во что-то читаемое. Я нашел этот очень полезный код:
//Here's how you'd go from a string to stuff like
// U+0053 U+0063 U+006f
string scott = "ฉ";
foreach (char s in scott) {
Console.Write("{0:x4} ", (int)s);
}
//Here's how converted a string (assuming it starts with U+)
// containing the representation of a char
// back to a char
// Is there a built in, or cleaner way? Would this work in Chinese?
string maybeC = "U+0063";
int p = int.Parse(maybeC.Substring(2),
System.Globalization.NumberStyles.HexNumber);
Console.WriteLine((char)p);
Заранее спасибо.
2 ответа
Читая в Википедии, я нашел эту статью, в которой говорится, что UCS-2 очень похож на UTF-16. Так:
string s = "07916698019021F00410D05479BDDC7CBBCB790008217002025501826A0049006E0063006F00720072006500630074002000700061007300730077006F00720064002E00200050006C06001073050200506E04065070200906F07072020700607307007060020600006007060090600E";
List<byte> bytes = new List<byte>();
for (int i = 0; i < s.Length; i+=2)
{
bytes.Add(byte.Parse(s.Substring(i, 2), NumberStyles.HexNumber));
}
var str = Encoding.Unicode.GetString(bytes.ToArray());
ВЫХОД: 鄇顦送င哐뵹糜쮻y℈ɰ唂舁jIncorrect password. P٬ကճ湐灐ठ牰܂怀ݳ瀀ɠ怀؇退
Попробуйте использовать встроенный System.Text.Encoding
учебный класс.
using System.Text;
// ..
var bytes = Encoding.GetEncoding("ucs-2").GetBytes("SomeString");
Изменить: вы можете конвертировать из кодировки UCS-2/UTF-16 с GetString(byte)
,