Национальный язык Таиланда, уникальный шрифт которого создает различные проблемы при обработке или визуализации текста.
2 ответа

Корейский, тайский и индонезийский POS-тегер

Кто-то может порекомендовать POS-тег с открытым исходным кодом для корейского, индонезийского, тайского и вьетнамского языков? Это я могу использовать, чтобы пометить данные корпуса, которые у меня есть в настоящее время. (например, Стэнфорд-Постагг…
12 мар '11 в 04:31
1 ответ

Qt: Unicodes / Utf-8 в QString занимает вечно (12 минут) для отображения на контроллере

Я делаю многоязычное приложение с Qt, в Eclipse/Linux. На тайском языке разрывы строк не очень хорошо поддерживаются на моем контроллере (я до сих пор не знаю, почему). В любом случае, следующий алгоритм вставляет пробел нулевой ширины (\u200b) межд…
12 фев '16 в 01:29
0 ответов

mbsrtowcs преуспевает, но как печатать char на char

Я на Mac OS X, использую clang++ 6.0. Я могу напечатать std::string символов Thai на моей консоли. Я могу преобразовать его в массив широких символов, используя mbsrtowcs(). Но печать за символом показывает только вопросительные знаки "?". Я не долж…
16 июл '18 в 19:44
1 ответ

Как читать и показывать тайский язык из RSS в Android 2.1?

Я использую 2.1. Я читаю RSS как один. Что я думаю, я должен изменить кодировку? "Например, InputStream inputStream = new ByteArrayInputStream(xmlResponse.getBytes("UTF-8"));" Или я должен установить TextView Font tp тайский шрифт? <item> <…
08 июн '11 в 06:50
1 ответ

Тайские проблемы со строками, вызванные неправильной длиной строки

Я пытаюсь выделить некоторую подстроку в тайском тексте: high = high.Insert(myString.Index + myString.Length + "<b>" + currentLength, "</b>"); Проблема в том, что myString Строка содержит специальный тайский символ ("เงินฝาก"). Заданная …
28 фев '15 в 06:35
1 ответ

Манипулирование тайскими символами в PHP

Я борюсь за то, чтобы тайские персонажи и PHP работали вместе. Вот что я хотел бы сделать: <?php mb_internal_encoding('UTF-8'); $string = "ทาง"; echo $string[0]; ?> Но вместо того, чтобы дать мне первый символ $string (ท), я просто получаю нек…
1 ответ

urllib2 не получает ту же строку html, что и обычные браузеры с теми же агентами (ошибка кодирования?)

Я пытаюсь получить страницу с этого сайта http://www.francais-thai.com/dicoweb/fran/00012.htm но в питоне (на странице есть тайский текст) вот код, который я пробовал: (это должно загрузить страницу) # -*- coding: utf-8 -*- import urllib2 agents = {…
04 авг '15 в 19:52
1 ответ

Проблема кодирования Postgresql с использованием tsearch с текстом на тайском языке после преобразования из MariaDB с использованием Pgloader

Я пытаюсь преобразовать базу данных MySQL UTF8mb4, которая содержит тайский и английский языки в Postgresql. Это, кажется, идет хорошо, пока я не пытаюсь добавить tsearch. Позвольте мне изложить шаги, предпринятые. Установите этот тайский парсер htt…
11 июл '17 в 09:24
1 ответ

Получение тайского персонажа в SAS

В настоящее время у меня есть файл xlsx с тайскими символами в нем, который правильно отображается в Excel. Однако, когда я импортирую этот файл в SAS EG 4.3 (также пробовал в 5.1), тайские символы отображаются как "???" Вот пример кода для того же …
15 окт '15 в 09:06
3 ответа

Настройте базу данных с параметром NLS_CALENDAR как "Тайский Будда"

Я хочу создать базу данных (Oraclev 12.1.0.2) с NLS_CALENDAR параметр "Тайский Будда" , в то же время мне нужно сохранить набор символов как AL32UTF8 . Когда я делаю это при настройке NLS_CALENDAR параметр не изменяется на уровне БД. SELECT SYSDATE …
22 июл '16 в 06:31
5 ответов

Регулярное выражение для принятия всех символов тайского языка и английских букв в python

Мне нужно векторизовать текстовые документы на тайском языке (например, Bag of Words, doc2vec). Сначала я хочу просмотреть каждый документ, опуская все, кроме символов тайского языка и английских слов (например, без знаков препинания, без цифр и дру…
27 июл '16 в 14:23
1 ответ

Ошибка при переименовании извлеченного файла Zip на другие языки в PHP

Я использую класс PHP ZipArchive для извлечения файла.zip. Он отлично работает для английского языка, но вызывает проблемы на моем местном языке (THAI). я использую icov('utf-8','windows-874',$zip->getNameIndex($i)) конвертировать UTF-8 в тайский…
05 июл '15 в 14:17
1 ответ

Как запросить строку с несколькими условиями?

У меня есть код запроса, как это. { "query": { "query_string" : { "query" : "content_normalization:*ชื่นชม*" } } } И я не могу использовать "матч" на тайском языке (я не знаю почему). Я хочу выполнить поиск в одном поле, которое содержит текст "ชื่นชม…
18 июл '18 в 08:23
1 ответ

Как мне манипулировать CSV, содержащими символы юникода (тайские), используя bash?

У меня есть дамп AdWords, содержащий тайские ключевые слова, которые я буду использовать для объединения данных из другой БД. Теоретически я беру файл, отсекаю ненужные строки сверху и снизу, немного его очищаю и загружаю в PostgreSQL как новую табл…
14 апр '16 в 11:15
1 ответ

Поиск входных данных GET/POST, не способных понять данные utf8_unicode_ci на тайском языке из БД MySQL

У меня есть тайский язык в базе данных MySQL с сопоставлением utf8_unicode_ci я использовал следующее, чтобы правильно отобразить его на моей веб-странице <head> <meta http-equiv="Content-Type" content="text/html" charset="UTF-8" /> <…
01 окт '17 в 17:09
1 ответ

Является ли это UTF-строкой или строкой Ansi "โค้ ¸¸1.5ลิตร(M)"

Я не уверен, что "โค๠¸¸1.5ลิตร(M)"является строкой UTF или строкой Анси. Что надёжно это обнаружить. Эта строка должна правильно отображать тайские символы. Если я не понимаю его текущую кодировку, я не могу применить преобразование, ч…
02 июл '18 в 10:46
2 ответа

C# отображает тайский в текстовом поле

Я создаю приложение, которое будет отображать Unicode в текстовое поле и графическое поле. У меня есть некоторые проблемы, когда я пытаюсь использовать тайский язык, я не говорю по-тайски, но знаю, что правила позволяют мне иметь персонажа, а затем,…
20 ноя '17 в 10:08
4 ответа

NSURL с тайским языком

У меня проблема с NSURL и таиландским языком, например, " http://www.xyp.com/?var=%E0%B9%84%E0%B8%97%E0%B8%A2", он не работает, но если вы используете " http://www.xyp.com/?var=Thai", то он Хорошо. Я не знаю, как решить эту проблему, пожалуйста, пом…
01 янв '10 в 18:01
3 ответа

Строка выравнивания по правому краю, содержащая тайские символы

Я хотел бы выровнять строки справа, содержащие тайские символы (тайский рендеринг не работает слева направо, но может также идти вверх и вниз). Например, для строк ไป (два символа, длина 2) и ซื้อ (четыре символа, длина 2) я хочу получить следующий в…
29 ноя '12 в 20:02
1 ответ

Java: в консоли тайский текст печатается как какой-то странный символ

Когда я печатаю тайский символ в консоли, он показывает какой-то странный символ. public static void main(String[] args) throws Exception{ byte[] bytes = "ฝ่ายขาย".getBytes("TIS-620"); String str = new String(bytes); System.out.println(str); } Это пе…
03 янв '14 в 07:40