Языки, поддерживаемые "латинскими" против "латинско-расширенных" глифов в шрифтах в Google Web Fonts?
Некоторые шрифты в Google Web Fonts поддерживают несколько "наборов символов". Дело в том, что если веб-шрифт, который я использую, обслуживает только "латинские" глифы, пользователи, которые переводят страницу на язык, глифы которого не поддерживаются, четко заметят испорченный текст.
Я хотел бы, чтобы мои веб-шрифты поддерживали самые популярные языки в мире, кроме английского, например, испанский, немецкий, французский и т. Д.
Для этого я хотел бы знать, на каких именно языках "латинский" и "расширенный латинский" обслуживаются индивидуально.
Я ожидаю, что ответ будет выглядеть так:
Latin Character Set & Supported Languages:
- ..........
- ..........
- ..........
Latin-Extended Character Set & Supported Languages:
- ..........
- ..........
- ..........
Я не смог найти эту информацию в документации по Google Web Fonts или в Google.
1 ответ
латынь
aka Unicode Latin1-Supplement (от U+0080 до U+00FF) предназначен для поддержки западноевропейских языков (как вы упомянули французский, немецкий, испанский, также ирландский, исландский, языки скандинавских стран и по совпадению также других языков, упомянутых в списке ниже: британский английский пропускает обычно используемый знак £, американский английский поддерживается стандартом ASCII).
Латинская Расширенная
Латинский расширенный означает практически блокировать Latin-Extended-A (U + 0100 до U+017F), который должен поддерживать большинство латинских текстов.
Latin1-Extended-B в основном содержит поддержку латиноамериканских языков Африки, а также 3 символа для румынского и азербайджанского языков, упомянутых ниже (может быть заменен символами из расширения A).
Существуют еще более экзотические расширения C, D и E, но эти символы никогда не используются в обычных электронных текстах. Чем больше символов содержится в шрифте, тем больше его размер (шрифты, покрывающие весь BMP, могут вырасти выше 10 МБ). Следовательно, не все символы из блока Latin-Extended должны присутствовать в категории Latin-Extended, особенно в сильно стилизованных шрифтах: это зависит от назначения шрифта или мотивов его автора. Чтобы узнать, поддерживает ли шрифт определенный язык, попробуйте отобразить символы из списка ниже.
Поддержка языков
В списке ниже я не считаю:
- орграфы, которые обычно заменяются отдельными символами (Æ поддерживается Latin1-Supplement)
- нелатинские алфавиты, так как речь идет о латыни против латиницы
- языки меньшинств и мертвых (эльфийский, фарерский, кашубский, черногорский, ливонский)
- ASCII алфавиты (например, голландский или гэльский) полностью поддерживаются ASCII
- исторические символы из рукописей
Пожалуйста, прокомментируйте, если что-то важное отсутствует или если какой-либо язык меньшинства используется в электронном общении. По умолчанию все языки нуждаются в блоке Latin-Extended-A, если примечания в списке не говорят иначе)
- Албанский Ç, Ë (Latin1-дополнение)
- , Ğ, I (строчные буквы без точек), İ, Ö, Ş, Ü, Ə (последний из Extended-B заменяется на Ä, затем тот же алфавит, что и турецкий)
- Сербский, боснийский и хорватский Ć, Č, Đ, Š, Ž
- Каталонский А, Е, Е, Я, Я, Я, Я, Ю (Латинская 1-Дополнение)
- Чешский Á, Č, Ď, Ě, É,,, Í, Ň, Ó, Ř, Š, Ť, Ú, Ů, Ý, Ž
- Датский, норвежский Æ, Å, Ø (Latin1-дополнение)
- Английский £, ¢
- Эстонский Ä, Ö, Õ, Ü, Š, Ž
- Эсперанто Ĉ, Ĝ, Ĥ, Ĵ, Ŝ, Ŭ
- Финский Å, Ä, Ö, Š, Ž (два последних редко используются, можно использовать S, Z, тогда достаточно Latin1-дополнение)
- Французский Æ, Œ, Â,,,,, È, Ê, Ë, Ç, Î, Î, Ô, Ù, Û, Ü, Ÿ, "," (редко используется Œ, Ÿ из Extended-A, остальные включают Latin на латинице 1-дополнение)
- Немецкий Ä, Ö, Ü, ß (Latin1-дополнение)
- Венгерский Á, É, Í, Ó, Ö, Ő, Ú, Ü, Ű
- Ирландский Á, É, Í, Ó, Latin (Latin1-дополнение)
- Исландский Æ, Á, É, Í, Ó, Ö, Ú, Ý, Þ, Ð (дополнение Latin1)
- Латышский Ā, Č, Ē, Ģ, Ķ, Ķ, Ī, Ļ, Ņ, Ō, Ū, Ŗ, Š, Ž
- Литовский Ą, Č, Ę, Ė, Š, Ų, Ū, Ž
- Польский Ą, Ć, Ę, Ł, Ń, Ó, Ś, Ź, Ż
- Португальский Á, Â, Ã, À, Ç, É, Ê, Ó, Ô, Õ, Ú
- Румынский Ă, Â, Î, Ș, Ț (последние 2 на латыни Extended B, можно использовать Ş, Ţ из Extended A)
- Словацкий Ä, Á, Č, Ď, É, Í, Í, Ĺ, Ľ, Ň, Ó, Ô, Ú, Š, Ŕ, Ť, Ý, Ž
- Сардинский Ç (Latin1-дополнение)
- Турецкий Ç, Ğ, I (без точек), İ, Ö, Ş, Ü
- Испанский и Галисийский С, ¿, ¡ (Latin1-Дополнение)
- Шведский Å, Ä, Ö (Latin1-дополнение)
- Вьетнамский Ă, Â, Đ, Ê, Ô, Ơ, Ư (+ объединение тонов 0x300 и 0x301)
- Валлийский, Ê, Î, Ô, Û, Ŵ, Ŷ
Объединение диакритических знаков
В качестве альтернативы шрифт может поддерживать блок "Объединение диакритических меток": от U+0300 до U+036F. Например, Ř может быть напечатано либо как U + 0158 (он же предварительно скомпонованный символ), либо как R + U + 030C. Программы, поддерживающие Unicode, должны отображаться одинаково, но если программа или шрифт не поддерживают репертуар, диакритическая метка объединения может оказаться немного неуместной, см. Этот очень подробный вопрос и ответ по Unicode в этой теме.
Другие персонажи для рассмотрения
Немецкий Fraktur, все еще широко используемый (то есть на большинстве дорожных указателей в Зальцбурге), содержит символы (например, морфы "s", упомянутые в ссылке), которые не в Unicode, не имеют точного латинского аналога, и некоторые шрифты отображают их как другие персонажи. Существуют и другие экзотические символы, которые могут быть полезны в электронных текстах (когда я был ребенком, меня учили "ch" как отдельное письмо на чешском алфавите после "h". Это не в Unicode, и поскольку электронные тексты преобладали на чешском языке в середине 90-х это больше не подчеркивалось, но в чешском языке последовательность "ch" все еще отсортирована после "h", более интересная информация здесь).
Полезные шрифты с поддержкой мультиязычности
Возможно, вы захотите настроить некоторые шрифты (если это позволяет их лицензия) с помощью службы Font Squirrel. Есть широкая поддержка бесплатных шрифтов для начала:
- Мне очень нравится красивый шрифт открытого типа Quivira с 11+k символами, 1,5 МБ
- на многих компьютерах установлен Arial Unicode (часть MS Office, 50 000 символов, 22 МБ)
- Существует проект Noto от Google, который содержит ВСЕ, но самые последние символы юникода в шрифтах с засечками, без засечек и в пользовательском интерфейсе, хорошо отсортированные по поддержке блоков (1,1 ГБ)
- в качестве последнего резервного шрифта, вы можете рассмотреть уродливый Unifont (50+k символов, но только 11 МБ)