Описание тега multibyte-functions
1
ответ
Объединить несколько вызовов mb_ereg_replace()-
Как я могу объединить эти замены в одно регулярное выражение? $style = $node->getAttribute("style"); $style = mb_ereg_replace("(direction:[[:space:]]*(rtl|ltr);)", "", $style) . " direction: {$direction};"; // remove existing direction-attribute …
13 апр '12 в 10:20
3
ответа
Как получить правильную позицию списка в многобайтовой строке, используя preg_match
Я в настоящее время сопоставляю HTML, используя этот код: preg_match('/<\/?([a-z]+)[^>]*>|&#?[a-zA-Z0-9]+;/u', $html, $match, PREG_OFFSET_CAPTURE, $position) Он идеально подходит ко всему, однако, если у меня есть многобайтовый символ, …
30 мар '12 в 21:51
4
ответа
mb_convert_encoding, неопределенная функция, пока включена mbstring
У меня есть сервер (Ubuntu 11.10 x64) под управлением PHP 5.3.8 с Apache2 / MySQL. В настоящее время я работаю над проектом, в котором мне необходимо выполнить определенную кодировку символов, но я обнаружил, что ни одна из многобайтовых (mb_* функц…
25 ноя '11 в 08:29
2
ответа
Справка по конверсии веб-сайта - UTF-8, охватывающая все базы... функции, метас и sql utf-8
Вы все проделали такую удивительную работу, отвечая на вопрос, который я думал раньше - я спрошу этот вопрос, прежде чем углубиться в свое обращение, только чтобы узнать, что я сделал что-то не так. У меня только 3 страницы на сайте, который я дел…
31 июл '11 в 17:58
1
ответ
PHP регулярное выражение для поиска заменить строковые функции в строковые функции мб
Решение состояло в том, чтобы смотреть в будущее и смотреть в прошлое - концепция LookArounds в RegEx помогла мне решить мою проблему, так как замены были съедены друг от друга, когда я сделал замену Поэтому мы некоторое время работали над тем, чтоб…
19 июл '18 в 17:08
1
ответ
Php - найти первые два символа ввода из базы данных mysql, используя функцию mb_
В настоящее время я использую функцию mb_strrichr для поиска символов в строке таблицы базы данных, но у меня возникает одна проблема. Для этого входного слова helloworld Я хочу найти только первые 2 символа из базы данных, чтобы он мог искать тольк…
21 дек '15 в 16:44
1
ответ
Как определить, есть ли у суррогата wchar_t (UTF-16)?
Я видел несколько других постов по этой проблеме, но не смог найти никаких деталей о том, как программно определить, использует ли кодовая точка более одного 2-байтового (в Windows) wchar_t. Пример: const wchar_t* s2 = L"\U0002008A"; // The "Han" ch…
18 апр '13 в 16:31
1
ответ
Как правильно использовать MultiByteToWideChar
Я использую MultiByteToWideChar для преобразования моей строки в строку. Сначала я пытаюсь получить необходимый размер для моей строки. Согласно документации, передавая 0 в качестве последнего аргумента, следует выполнить это. С помощью MultiByteToW…
29 июл '14 в 21:25
2
ответа
REGEXP, чтобы преобразовать любые 3 символа или меньше слова в wordVVV
Я пытаюсь преобразовать любое вхождение слова с 3 или менее символами в одно и то же слово с прикрепленной к нему строкой VVV.Пример: for -> forVVVЯ не использую латинские символы (UTF8), следовательно, MB.Что у меня есть: $pattern='\b[.{1,6}]\b'; $…
03 сен '09 в 14:30
2
ответа
PHP многобайтовые альтернативы UTF8
Я искал UTF8-безопасные альтернативы для функций работы со строками. Я нашел много разных мнений и предложений. Я хотел бы спросить, могут ли следующие функции вызывать проблемы в UTF-8, и если да, что я должен использовать вместо этого. Я знаю спис…
24 авг '12 в 14:42
1
ответ
Обрезать многобайтовую строку примерно до n слов с помощью функций PHP mb
После того, как я задал этот вопрос на SO, мне нужно было подготовить пользовательскую функцию PHP, чтобы получить краткую версию моей строки, потому что я не мог найти прямой ответ / код в сети. Требования были: знать о multibyte language для таких…
08 сен '14 в 17:04
2
ответа
Как я могу получить правильную позицию слова в тексте UTF-8?
У меня есть простой код PHP, чтобы получить предложения текста и жирным шрифтом конкретного слова. Прежде всего я получаю массив со словами, которые я хочу, и их положение в тексте. $all_words = str_word_count($text, 2, 'åæéø'); // $words is an arra…
04 фев '14 в 12:40
3
ответа
Многобайтовые символы в libc regcomp и regexec
Есть ли в любом случае, чтобы получить libc6регулярные выражения regcomp а также regexec правильно работать с многобайтовыми символами? Например, если мой шаблон - символы utf8 猫机+猫найти совпадение в кодированной строке utf8 猫机机机猫 потерпит неудачу т…
23 янв '15 в 17:52
0
ответов
WideCharToMultiByte производит китайские символы при записи в регистр
У меня есть этот древний фрагмент кода для IE BHO, и я пытаюсь сохранить некоторые данные для него. Я пытаюсь такой подход: // key is an LPWSTR provided as a method parameter // sValue is an LPWSTR provided as a method parameter HKEY hKey = NULL; HR…
06 окт '15 в 14:56
0
ответов
Не все символы ASCII перекодированы в wchar_t с помощью mbstowcs
Я посмотрел на несколько похожих вопросов, но не могу найти решение своей проблемы: я пытаюсь преобразовать символы из ASCII в широкие символы (Windows UTF16), чтобы напечатать их в окне (цель состоит в том, чтобы захватить пользовательские наборы с…
13 авг '15 в 18:45
1
ответ
Как сортировать строки в юникоде, используя предопределенный алфавит?
У меня есть таблица MySQL со словами в Unicode, используя такие знаки, как ḥ, ḫ šи т. д. Столбцы в таблице определены как utf8mb4_general_ci и признать вышеупомянутые знаки. В шапке сайта я положил <meta http-equiv="Content-Type" content="text/ht…
19 апр '18 в 11:31
2
ответа
strpos ищет юникод в PHP (и обрабатывает встроенный UTF-8)
У меня возникла проблема, связанная с простым поиском двухсимвольной строки Unicode (игла) внутри другой строки (стог сена), которая может быть или не быть UTF-8 Часть проблемы в том, что я не знаю, как указать код для использования в strpos, и я не…
23 авг '10 в 08:24
2
ответа
Многобайтовая функция для замены preg_match_all?
Я ищу многобайтовую функцию для замены preg_match_all(), Мне нужен один, который даст мне массив совпадающих строк, таких как $matches аргумент от preg_match(), Функция mb_ereg_match() кажется, не делает это - это только дает мне логическое значение…
06 окт '11 в 14:18
2
ответа
Объединить два байта в WideChar
Можно ли совместить два Bytes в WideChar и если да, то как?Например, буква "ē" в двоичном виде 00010011 знак равно 19 а также 00000001 знак равно 1, или же 275 все вместе. var WChar: WideChar; begin WChar := WideChar(275); // Result is "ē" var B1, B…
02 янв '13 в 11:05
3
ответа
Безопасно ли использовать `strstr` для поиска многобайтовых символов UTF-8 в строке?
После моего предыдущего вопроса: почему `strchr`, кажется, работает с многобайтовыми символами, несмотря на отказ от руководства на странице? Я понял что strchr был плохой выбор. Вместо этого я думаю об использовании strstr искать один символ (много…
29 авг '14 в 15:38