Описание тега multibyte-characters

2 ответа

Текст UTF-8 в приложении MFC, использующий многобайтовый набор символов

Я работаю над приложением, которое получает текст, закодированный в UTF-8, и должно отображать его на каком-либо элементе управления MFC. Приложение создается с использованием набора символов MultiByte (MBCS), и давайте предположим, что это не может…
01 фев '19 в 17:57
0 ответов

LastDelimiter не находит последний пробел

Я использую C++ Builder 10.2 Токио, и мне нужно найти позицию последнего пробела в String переменная, которая имеет значение как "XXX YYYYY TYUR KXYZ"; Если я использую функцию LastDelimiter(const System::UnicodeString Delimiters, const System::Unic…
0 ответов

mbsrtowcs преуспевает, но как печатать char на char

Я на Mac OS X, использую clang++ 6.0. Я могу напечатать std::string символов Thai на моей консоли. Я могу преобразовать его в массив широких символов, используя mbsrtowcs(). Но печать за символом показывает только вопросительные знаки "?". Я не долж…
16 июл '18 в 19:44
1 ответ

Как сортировать строки в юникоде, используя предопределенный алфавит?

У меня есть таблица MySQL со словами в Unicode, используя такие знаки, как ḥ, ḫ šи т. д. Столбцы в таблице определены как utf8mb4_general_ci и признать вышеупомянутые знаки. В шапке сайта я положил <meta http-equiv="Content-Type" content="text/ht…
4 ответа

Rails усекает строки UTF-8, содержащие & eacute; (например)

Я работаю над приложением rails 3.1 с ruby 1.9.3 и mongoid в качестве моего ORM. Я сталкиваюсь с раздражающей проблемой. Я хотел бы обрезать содержание сообщения, как это: <%= raw truncate(strip_tags(post.content), :length => 200) %> я испо…
1 ответ

Является ли sizeof('ab') равным sizeof(int) в C++?

Учитывая, что у меня есть следующая программа, которая определяет размер многобайтовых символов. #include<iostream> int main() { std::cout<<"size of multibyte characters : "<<sizeof('ab')<<std::endl; } Мой компилятор GCC выда…
05 ноя '17 в 19:19
1 ответ

Преобразование старого проекта Visual Studio C++ из многобайтового набора символов

Я хотел бы перенести старый проект C++ MFC из Visual Studio 2005 в более новую версию. В проекте используется многобайтовый набор символов, который, как я знаю, больше не поддерживается в текущей Visual Studio. Поэтому первым шагом должно стать созд…
28 дек '17 в 14:18
1 ответ

Как найти неизвестный символ в MySQL или в массиве

Сначала я создал базу данных с utf8mb4_general_ci сопоставление и созданная таблица с таким же сопоставлением. Затем я импортирую CSV-файл с load data local infile '/mnt/c/Users/justi/Desktop/enml/enml.csv' into table dict CHARACTER SET utf8mb4 fiel…
11 фев '19 в 08:22
1 ответ

Как посчитать количество многобайтовых символов?

Я хотел бы получить 5 вместо 10 для следующей программы. Кто-нибудь знает, как исправить код для подсчета количества многобайтовых символов? Благодарю. /* vim: set noexpandtab tabstop=2 shiftwidth=2 softtabstop=-1 fileencoding=utf-8: */ #include &lt…
08 фев '19 в 15:05
1 ответ

Как работает многобайтовый символ '\377777'?

Clang упомянул эту штуку мне, когда я пытался найти несколько нестандартных способов найти std::numeric_limits<size_t>::max() для меня allocator::max_size() Кажется, что размер выражения ограничен 4 байтами, поэтому он выглядит как многобайтов…
2 ответа

C++ Использование wstring_convert в Linux

Я хотел бы иметь возможность преобразовывать текст, прочитанный из файла в многобайтовые символы. У меня есть следующий код C++ на Windows, который работает для меня. Когда я пытаюсь скомпилировать код на Linux, хотя это не удается. #include <loc…
14 июн '18 в 23:27
0 ответов

Почему я не могу преобразовать многобайтовую строку в широкую строку? mbsrtowcs завершается ошибкой с EILSEQ, хотя mbstring кажется допустимым

Пожалуйста, посмотрите этот фрагмент, который я написал, который должен просто преобразовать многобайтовую строку (полученную из стандартного ввода) в широкую строку. Прочитав mbsrtowcs а также mbstate_t документация из cppreference я думал, что это…
0 ответов

Как изменить шрифт по умолчанию в зависимости JavperReport Maven для поддержки китайских символов?

Я пытаюсь использовать Arial Unicode MS в моих сгенерированных jasperstudio pdf-файлах в моем java-приложении. Тем не менее, я получаю эту ошибку: net.sf.jasperreports.engine.JRRuntimeException: Could not load the following font: pdfFontName: Arial …
3 ответа

В MySQL 5.7 отсутствует совпадение со словами из двух китайских символов

Таблица ТБ: title keywords 企业贷款,该如何看懂银行流水 出口退税,贷款,现金流量表,利润表 最高人民法院关于审理民间 企业贷款,合同法,贷款 中国宏观经济数据点评 企业贷款,贷款 ngram_token_size=2 FULLTEXT INDEX `keywords_title`(`keywords`, `title`) Теперь я сопоставляю ключевые слова и заголовок со словом из четырех кита…
17 апр '18 в 14:35
0 ответов

Предупреждение: ошибка в FUN: неверная многобайтовая строка 4

Я создал блестящее приложение для создания облака слов либо из текстового файла, либо используя собственные слова. Когда я запускаю его из R studio, он работает нормально. Но как только я публикую в shinyapps.io, это работает, когда я использую свои…
2 ответа

Преобразовать строку в массив символов - многобайтовый

Предполагая, что в 2019 году каждое решение, которое не является UNICODE-безопасным, является неправильным. Каков наилучший способ преобразования строки в массив символов UNICODE в PHP? Очевидно, это означает, что доступ к байтам с синтаксисом скобо…
21 апр '19 в 10:53
0 ответов

JSch - невозможно перечислить некоторые пути к файлам, содержащие многобайтовые символы

Я пытаюсь получить список файлов из папки на сервере Windows SFTP с помощью JSch. Одно из поведения, которое я вижу, это: После определенного количества символов файл даже не попадает в список, и исключение не выдается. Например: Файл, который не ук…
19 авг '19 в 22:49
0 ответов

Spark.Sql не может прочитать японский язык (Mutltbyte charater) из таблицы улья?

Я пишу японский символ в таблице улья как часть одной из моих программ. Позже, когда я выбираю это поле в Hive, я могу его прочитать, но когда я читаю его из Spark.sql, он не дает ожидаемого результата. spark.sql("select SQL_VAL as sql_val from abc.…
0 ответов

Как рассматривать многобайтовые символы просто как последовательность байтов?

Я хотел бы использовать vim с двоичными файлами. Я бегу, запускаю vim с-b и я имею isprint = а также display += uhex. Я использую следующиеstatusline: %<%f\ %h%m%r%=%o\ (0x%06O)\ \ %3.b\ <%02B>\ %7P поэтому я получаю вывод, содержащий некот…
10 окт '19 в 20:33
0 ответов

Поиск в столбце Oracle NCLOB в однобайтовой среде Oracle

Развертывание ORACLE 12.01 Набор символов однобайтового развертывания: NLS_NCHAR_CHARACTERSET AL16UTF16 NLS_CHARACTERSET WE8MSWIN1252 Набор символов многобайтового развертывания: NLS_NCHAR_CHARACTERSET AL16UTF16 NLS_CHARACTERSET AL32UTF8 У меня есть…