CJK означает китайский, японский и корейский языки и используется для обозначения проблем, общих для этих восточноазиатских языков и их обширного репертуара персонажей.
5 ответов

Вывод файла UTF-8 в R

Я использую R 2.15.0 на Windows 7 64-битной. Я хотел бы вывести текст Unicode (CJK) в файл. В следующем коде показано, как символ Unicode, отправляемый для записи в файловое соединение UTF-8, не работает так, как ожидалось (I): rty <- file("test.…
20 май '12 в 16:56
2 ответа

Где я могу найти бесплатный движок китайского рукописного распознавания для Android/IPhone?

Я заинтересован в разработке того, что будет использовать китайское программное обеспечение для распознавания рукописного текста на смартфонах. Прежде чем начать, я хотел проверить, есть ли какие-либо бесплатные (для открытого и коммерческого исполь…
09 янв '12 в 02:22
2 ответа

Разобрать строку японской валюты с помощью java.text.NumberFormat

Я сталкиваюсь с проблемами при разборе японской строки валюты на Java. Кажется, что символ йены не соответствует тому, что, по мнению Java, должно быть. Вот мой код: NumberFormat f = NumberFormat.getCurrencyInstance(Locale.JAPAN); String s = "¥200";…
06 май '11 в 12:44
1 ответ

Как скомпилировать библиотеку Qt 4.7.1 с поддержкой текстовых кодеков?

Я успешно построил статическую библиотеку Qt и увидел плагины /codecs/libqcncodecs.a, но я все еще не могу использовать GB18030, например так: QTextCodec::codecForName("GB18030") и все, что я до сих пор не мог найти китайские связанные кодеки foreac…
06 дек '10 в 09:49
2 ответа

Иностранные символы в Android и Java

Я пытался загрузить и проанализировать веб-страницу с иностранными (китайскими) символами. Я не уверен, должен ли я использовать "utf-8" или что-то еще. Но ни один из них, кажется, не работает для меня. Я использовал пример кода Wikitionary для getU…
19 янв '10 в 07:18
0 ответов

Как определить упрощенный вариант Unicode семантического варианта традиционного китайского символа?

Как упоминалось в ответе на таблицу упрощенного китайского Unicode, база данных Unihan указывает, имеет ли традиционный символ упрощенный вариант (kSimplifiedVariant). Однако некоторые символы имеют семантические варианты (kSemanticVariant), которые…
31 мар '16 в 13:56
0 ответов

Разбор китайских символов для возможного произношения / индекса CJK?

Я делаю организующую программу (на C#) и пытаюсь создать функцию индексации для индексации CJK (и, по возможности, вьетнамского). Если есть китайская строка, я хочу проанализировать ее по возможному индексу в китайском пиньинь / чжуинь, штрихах, кор…
03 окт '18 в 03:16
2 ответа

Разрешить только половину ширины катакана (японский) символов в текстовом поле

В моем приложении Rails у меня есть текстовое поле, как это <%= f.text_field :guaranter_furigana_name, autocomplete: "off", class: "form-control", placeholder: "例:ヤマダ タロウ(全角カナ)", maxlength: "50", :disabled => @disabled_field %> Я использую …
19 июл '16 в 08:40
1 ответ

Китайский шрифт отображается неправильно при FontSize менее 22

По большей части мое приложение отображает различные наборы символов без проблем. Однако есть некоторые китайские иероглифы, которые хорошо отображаются FontSize 22, но ужасно, когда он меньше Это было предоставлено следующим фрагментом XAML, которы…
05 дек '16 в 15:10
3 ответа

Как пометить весь текст CJK в документе?

У меня есть файл, file1.txt, содержащий текст на английском, китайском, японском и корейском языках. Для использования в ConTeXt мне нужно отметить каждую область текста в файле в соответствии с языком, кроме английского, и вывести новый файл, напри…
07 май '12 в 13:23
5 ответов

Как искать все символы CJK в vim?

Я могу искать CJK символ (например, 小) с использованием кодовой точки Unicode: /\%u5c0f /[\u5c0f] Я не могу найти все символы CJK, используя [\u4E00-\u9FFF]потому что руководство vim говорит: :help /[] NOTE: The other backslash codes mentioned above…
28 апр '12 в 14:01
2 ответа

Строка Unicode для китайских символов

У меня есть строка в кодировке Unicode, скажем, "U+660E", и я хочу отобразить соответствующий символ, который в данном случае равен 明. Смотрите эту страницу (Ctrl-F, чтобы найти 明). Мой код до сих пор: string unicodeString = reader.GetString(0); uni…
13 ноя '12 в 07:59
1 ответ

Не удается правильно импортировать файл CSV (китайский UTF-8) в БД с помощью JRuby & "CSV"

Использование jruby 1.6.4 (ruby-1.9.2-p136) Файл CSV имеет кодировку UTF-8. Содержимое отображается нормально с TextMate. Пытаясь это, но все, что я получаю, это искаженный текст, вставленный в БД. CSV.foreach(data_file_path, :headers=>false, :en…
18 окт '11 в 14:29
2 ответа

Сортировка японского текста по Катакана в C#

Можно ли отсортировать список японских струн по катакане?
01 авг '11 в 14:40
1 ответ

jQuery ajax метод не работает в Internet Explorer

У меня есть следующий фрагмент кода jQuery, работающий в каждом браузере (Firefox, Chrome, Opera), но не работающий в Internet Explorer. Это div с корзиной покупок и показывает продукты на китайском языке. Но когда дело доходит до Internet Explorer,…
18 ноя '11 в 20:55
2 ответа

Корейский, тайский и индонезийский POS-тегер

Кто-то может порекомендовать POS-тег с открытым исходным кодом для корейского, индонезийского, тайского и вьетнамского языков? Это я могу использовать, чтобы пометить данные корпуса, которые у меня есть в настоящее время. (например, Стэнфорд-Постагг…
12 мар '11 в 04:31
2 ответа

Как я могу сопоставить несколько элементов, заключенных в угловые скобки, с регулярным выражением Python?

У меня есть несколько строк, которые выглядят так: <a href="javascript:updateParent('higashino/index.html')">東野 圭吾「夢幻花」「白夜行」</a>他<br> Теперь я хочу извлечь ссылку и строки внутри угловых скобок ("「"и"」"), вот так: ['higashino/index…
09 мар '14 в 17:22
3 ответа

Подтверждение ввода Кана

Я работаю над приложением, которое позволяет пользователям вводить символы японского языка. Я пытаюсь найти способ определить, является ли пользовательский ввод японской кана (хирагана, катакана или кандзи). В приложении есть определенные поля, в ко…
23 дек '08 в 07:23
2 ответа

Разрешены ли китайские символы в URL?

Разрешено ли вводить китайские иероглифы в URL? Как было проверено, китайские символы можно вводить в URL-адресах, и они также преобразуются в punycode, также отправляют запрос и переходят на соответствующую страницу. Но на данный момент, есть ли ещ…
25 авг '11 в 03:24
3 ответа

Ruby: разбор времени на китайском

Время такое 2016年4月27日 (год, месяц, дата) Что было бы хорошим способом разобрать это? Я думаю, что я могу сойти с рук что-то вроде time = '2016年4月27日' year = time.split('年')[0] А затем реорганизовать время. Но это также включает в себя encoding utf-…
01 май '16 в 06:14