Описание тега utf-32

UTF-32 - это кодировка символов, которая представляет все кодовые точки Unicode в четырех байтах на символ.
1 ответ

Преобразование UTF-8 в UTF-32 с предварительным вычислением количества символов в каждом

У меня есть рабочий алгоритм для преобразования строки UTF-8 в строку UTF-32, однако я должен выделить все пространство для моей строки UTF-32 заранее. Есть ли способ узнать, сколько символов в UTF-32 займет строка UTF-8. Например, строка UTF-8 "¥0"…
24 май '12 в 19:35
0 ответов

C# datatable тип данных в UTF32

У меня сложная проблема. В настоящее время я получаю таблицу данных из SQL, которая имеет EM-DASH и другие специальные символы, которые таблица данных не поддерживает, если только тип не в UTF32. Есть ли способ преобразовать тип данных из строки в U…
23 июн '16 в 18:00
1 ответ

Можно ли объединить строки с большими символами (UTF32String) в Julia-lang?

Создайте UTF32String (b,c), где b содержит большое значение: using LegacyStrings a=Char(69058047) b=UTF32String(a) c=UTF32String("") Теперь объедините b и c в d: d=b*c Прочитайте b, c, d соответственно. b сохранил свое значение, но d был принудитель…
18 янв '18 в 10:00
1 ответ

Печать символов UTF32 в макросах Word

Я играю с VBA для Word, и я работаю над проектом, чтобы сделать пакетный поиск / замену в текстовом документе. Я импортировал список условий поиска / замены из.csv. Проблема, с которой я сталкиваюсь, заключается в том, что я хочу заменить слова симв…
23 ноя '15 в 14:22
2 ответа

Какие библиотеки с открытым исходным кодом C или C++ могут конвертировать произвольные UTF-32 в NFC?

Какие библиотеки с открытым исходным кодом C или C++ могут конвертировать произвольные UTF-32 в NFC? Библиотеки, которые, я думаю, могут сделать это до сих пор: ICU, Qt, GLib (не уверены?). Мне не нужна никакая другая сложная поддержка Юникода; прос…
24 ноя '11 в 06:35
2 ответа

Нет UTF-32 с прямым порядком байтов в C#?

В C# Encoding.UTF32 является UTF-32 с прямым порядком байтов, Encoding.BigEndianUnicode является UTF-16 big-endian, Encoding.Unicode это UTF-16 с прямым порядком байтов. Но я не могу найти для UTF-32 big-endian. Я разрабатываю простой просмотрщик те…
06 окт '15 в 15:23
2 ответа

Истинное двухбайтовое кодирование

Существуют ли реальные двухбайтовые кодировки (DBCS)? За исключением UCS-2, UTF-16, конечно. Я имею в виду кодирование, которое также сохраняет ASCII как 2 байта. Я имею в виду с нулевыми байтами. (00 20 - пробел) Пожалуйста, сообщите, если он испол…
5 ответов

UTF32 и C# проблемы

Так что у меня проблемы с кодировкой символов. Когда я помещаю следующие два символа в текстовый файл в кодировке UTF32: 鸕 и затем запустите на них этот код: System.IO.StreamReader streamReader = new System.IO.StreamReader("input", System.Text.Encod…
03 апр '12 в 05:44
1 ответ

Почему UTF-32 использует четыре байта?

Если UTF-32 ограничен UCS-4 17 плоскостями (1114111 символьных точек), для которых требуется 21 бит, что делает четвертый байт?
12 фев '17 в 21:58
1 ответ

UTF-8 имеет фиксированный порядок байтов

Я слышал, что мне не нужно размещать спецификацию в начале файла / потока UTF-8. Есть ли у него фиксированный порядок байтов? А как насчет UTF-16 и UTF-32 в этом случае?
19 янв '16 в 14:50
1 ответ

Можно ли преобразовать строку, содержащую "высокие" символы Юникода в массив, состоящий из значений de c, полученных из utf-32 ("реальных") кодов?

Пожалуйста, посмотрите на этот скрипт, работающий с (теоретически возможной) строкой: <!doctype html> <html> <head> <meta charset="utf-8"> <title></title> <script src="jquery.js"></script> <script&g…
04 фев '13 в 03:20
2 ответа

Поддерживает ли std::wstring UTF-16 и UTF-32 в Windows?

Я изучаю Unicode и у меня есть несколько вопросов, на которые я надеюсь ответить. 1) Я читал, что в Linux std:: wstring составляет 4 байта, а в Windows - 2 байта. Означает ли это, что внутренняя поддержка Linux - UTF-32, а Windows - UTF-16? 2) Схоже…
19 сен '14 в 16:23
2 ответа

Во время разговора с UTF32 на UTF8 с использованием UTF8-CPP я получаю ошибку "utf8::invalid_code_point"

Моя программа получает входную китайскую строку в кодировке utf32: ./myprogram 我想玩 Я хочу преобразовать это в utf8, для этого я использую библиотеку UTF8-CPP http://utfcpp.sourceforge.net/ #include "source/utf8.h" using namespace std; int main(int a…
27 янв '18 в 09:00
2 ответа

Как определить ширину строки Юникода в терминале?

Я работаю над терминальной программой, которая поддерживает Unicode. Есть определенные случаи, когда мне нужно определить, сколько терминальных столбцов будет использовать строка, прежде чем я ее напечатаю. К сожалению, некоторые символы имеют ширин…
23 май '16 в 17:30
0 ответов

Не нужно ли кодирование / декодирование для связи системы с использованием другой кодировки UNICODE?

Мне просто интересно. Когда две системы используют другую кодировку Unicode (one-UTF-8, other-UTF32), ей не нужно кодировать или декодировать? Я думаю, что это необходимо. Но мы называем просто UNICODE в визуальной студии. Затем, если это необходимо…
22 авг '17 в 06:31
0 ответов

Отправить сообщение с помощью net.Socket в utf32be

Я пытаюсь создать соединение между моим сервером node.js и другим приложением, используя net.Socket. В другой версии приложения ожидаемое приложением сообщение находится в utf16le, поэтому подходящий рабочий код для него: netSocket.write("некоторая …
13 авг '18 в 07:40
2 ответа

Преобразовать __int64 в std::u32string

Я пишу родное приложение для Windows C++, которое использует Casablanca REST API. Я пытаюсь передать целочисленное значение из приложения C++ в сервлет Java, который будет работать в облаке. Делая GET Вызов REST, API Касабланки ожидает от меня испол…
01 июл '15 в 12:49
1 ответ

Загруженный неанглийский html-файл не читается в webview

Сохранить (малаялам) код содержимого строки String A = "<html><head><style>" + "@font-face { font-family: Manorama;src: url(file:///android_asset/Manorama.ttf); }" + "h1 { color: #222;font-size: 26px;margin-top: 32px; }" + "</st…
5 ответов

Какой смысл в UTF-16?

Я никогда не понимал смысл кодировки UTF-16. Если вам нужно иметь возможность обрабатывать строки как произвольный доступ (т. Е. Кодовая точка совпадает с кодовой единицей), тогда вам нужен UTF-32, поскольку UTF-16 по-прежнему имеет переменную длину…
13 мар '11 в 20:28
1 ответ

Печать символа UTF-32 на терминале

Я читаю пользовательский ввод из GLFW с помощью обратных вызовов (устанавливается с помощью glfwSetCharCallback) в соответствии с этой страницей: http://www.glfw.org/docs/latest/input.html Функция обратного вызова получает нажатую клавишу как 32-раз…
07 сен '16 в 17:33