Описание тега multibyte

PHP (mbstring) provides multibyte specific string functions that help you deal with multibyte encodings
1 ответ

Многобайтовые символы повреждены до???? при чтении из базы данных и публикации на странице ASP с использованием HTTPURLConnection

В моем Java-коде я извлекаю некоторые многобайтовые данные из базы данных и создаю некоторый XML-DOM, используя эти данные в качестве значения некоторого узла, затем преобразовываю DOM в String и отправляю байты на ASP-страницу через HTTPURLConnecti…
19 фев '11 в 12:57
1 ответ

Как кодировать пользовательскую функцию выдержки, используя mb_substr для возврата 140 многобайтовых символов в WordPress?

Я не совсем уверен, что я делаю, но нашел этот код онлайн для пользовательской выдержки, так как я пытаюсь вернуть 140 многобайтовых японских символов на пользовательской главной странице в WordPress. Может быть, у меня нет функции strip_tags. Если …
29 дек '10 в 17:56
3 ответа

Как получить правильную позицию списка в многобайтовой строке, используя preg_match

Я в настоящее время сопоставляю HTML, используя этот код: preg_match('/<\/?([a-z]+)[^>]*>|&#?[a-zA-Z0-9]+;/u', $html, $match, PREG_OFFSET_CAPTURE, $position) Он идеально подходит ко всему, однако, если у меня есть многобайтовый символ, …
30 мар '12 в 21:51
1 ответ

preg_replace с кириллическими символами

Я хочу заменить эти символы [^a-z а-з0-9_] на null, но я не могу сделать это, когда его многобайтовая строка. Я попытался с mb_*, iconv, PCRE, mb_eregi_replace и модификатором u (для PCRE), но ни один из них не работал хорошо. Mb_eregi_replace работ…
12 окт '11 в 16:45
0 ответов

Многобайтовая SQL-инъекция

Это очень часто обсуждаемая проблема, я знаю, но недавно я обнаружил эту уязвимость, и я проверяю, устойчив ли я к такой инъекции, однако я не могу имитировать такое поведение. Возможно, я не понимаю, какой запрос они используют. Часть, которая меня…
22 апр '12 в 18:18
2 ответа

UCS-4 в многобайтовое преобразование в Solaris

Почему этот код: char a[10]; wchar_t w[10] = L"ä"; // German a Umlaut int e = wcstombs(a, w, 10); вернуть е == -1? Я использую Oracle Solaris Studio 10 на Solaris 11. Локаль - Latin-1, которая содержит немецкие умлауты. Все документы, которые я наше…
25 апр '12 в 16:26
1 ответ

Сообщение об ошибке "Недопустимый многобайтовый escape: /^\xFF\xFE/ (SyntaxError)" в Heroku

Я использую драгоценный камень VPIM для рельсов для создания vcards для пользователей на основе информации их профиля. На моем локальном хосте все работает нормально, но при развертывании в Heroku приложение вылетает. Я получаю сообщение об ошибке н…
2 ответа

Многобайтовое отображение символов в консоли Java

У меня есть текст для печати на тамильском языке. Как я могу напечатать это на тамильском языке на консоли Java. Я тестирую кусок кода, и для отладки мне нужно увидеть напечатанный текст. public static void main(String[] args) { String str = "வீடிவீ…
10 май '16 в 08:01
1 ответ

C# строка многобайтовая C++, GIF двоичные данные преобразовать в PNG или изображение

Я серьезно застрял в этой проблеме. эта проблема вызвана тем, что я слаб с концепцией C#. все, что я хочу сделать, это электронное оборудование вернуть данные в формате GIF. который является двоичным, я верю. поэтому я хочу преобразовать эти данные …
16 окт '14 в 18:02
2 ответа

Японские символы в виджете Yii Captcha?

Работа над веб-приложением на японском форуме выполнена в Yii. Проблема в том, что мы начинаем получать спам на английском языке, поскольку капча написана на английском языке, и любой, кто может ее прочитать, может спамить. Я хотел бы иметь капчу в …
17 мар '13 в 13:07
1 ответ

Как показать кириллический текст в многобайтовом приложении MFC?

Я новичок в C++ и MFC. Основная проблема в том, что у меня есть проект МФЦ, который нужно перевести на русский язык. Я вижу, что лучше всего изменить проект на Unicode, но я не могу, потому что это огромный проект, и когда я меняюсь, я получаю более…
09 мар '18 в 11:08
1 ответ

R-недопустимая многобайтовая строка 1

Я новичок в программном обеспечении R Теперь изучаем майнинг текста с использованием пакета "тм" У меня есть проблема с отображением текста в нижний регистр sms_raw<-read.csv(............) sms_corpus<-Corpus(VectorSource(sms_raw$text)) sms_cor…
05 ноя '14 в 07:29
7 ответов

Многобайтовая обрезка в PHP?

Видимо нет mb_trim в mb_* семья, поэтому я пытаюсь реализовать один для себя. Я недавно нашел это регулярное выражение в комментарии в http://php.net/: /(^\s+)|(\s+$)/u Итак, я бы реализовал это следующим образом: function multibyte_trim($str) { if …
08 апр '12 в 21:23
2 ответа

Обнаружение правильной кодировки символов в PHP?

Я пытаюсь определить кодировку строки, но не могу получить правильный результат.Например: $str = "€ ‚ ƒ „ …" ; $str = mb_convert_encoding($str, 'Windows-1252' ,'HTML-ENTITIES') ; // Now $str should be…
05 апр '13 в 21:57
1 ответ

PHP mb_split(), захват разделителей

preg_split имеет дополнительный PREG_SPLIT_DELIM_CAPTURE флаг, который также возвращает все разделители в возвращаемом массиве. mb_split не. Есть ли способ разбить многобайтовую строку (не только UTF-8, но и все виды) и захватить разделители? Я пыта…
02 июн '15 в 19:42
4 ответа

_tcslen в многобайтовом наборе символов: как преобразовать WCHAR [1] в const char *?

Я ищу в интернете около 2 часов и не нахожу никакого рабочего решения. Моя программа имеет многобайтовый набор символов, в коде я получил: WCHAR value[1]; _tcslen(value); И при компиляции я получил ошибку: 'strlen': невозможно преобразовать параметр…
27 дек '09 в 18:51
2 ответа

Итерация обратной многобайтовой строки - C

Я знаю, что могу перебирать вперед через многобайтовую строку в C, используя mbrtowc(). Но что, если бы я хотел повторить в обратном направлении; или, другими словами, как мне найти предыдущий действительный многобайтовый символ. Я попробовал следую…
17 апр '16 в 00:00
1 ответ

Как заставить функцию PHP Similar_text() работать для японских символов (кандзи, катакана и хирагана)?

Я хочу использовать функцию Similar_text(), предоставляемую PHP для японских символов. Но, к сожалению, это дает неправильный ответ. Как я могу заставить это работать? Например: similar_text('土橋勇樹', '東日刷株式')дает результат 3, но мы можем ясно видеть,…
22 янв '19 в 06:53
2 ответа

Проект Qt5 в MSVC 2010, требуется многобайтовый набор символов, но изменение набора символов проекта не работает

Я делаю свои первые шаги с Qt в MSVC. Я использую Visual Studio 2010 и Qt 5.3. Все работает нормально, но теперь у меня есть устаревший C-код, который я должен включить в свой проект. Этот c-код использует 8-битные символы для загрузки библиотек DLL…
08 июл '14 в 12:18
4 ответа

Php не может найти способ разбить строки utf-8

Я только начал заниматься php и боюсь, что мне нужна помощь, чтобы понять, как манипулировать строками utf-8. Я работаю в Ubuntu 11.10 x86, PHP версии 5.3.6-13ubuntu3.2. У меня есть файл в кодировке utf-8 (vim :set encoding подтверждает это), которы…
03 дек '11 в 17:39