Языки, поддерживаемые "латинскими" против "латинско-расширенных" глифов в шрифтах в Google Web Fonts?

Google Web Fonts Выбрать наборы символов

Некоторые шрифты в Google Web Fonts поддерживают несколько "наборов символов". Дело в том, что если веб-шрифт, который я использую, обслуживает только "латинские" глифы, пользователи, которые переводят страницу на язык, глифы которого не поддерживаются, четко заметят испорченный текст.

Я хотел бы, чтобы мои веб-шрифты поддерживали самые популярные языки в мире, кроме английского, например, испанский, немецкий, французский и т. Д.

Для этого я хотел бы знать, на каких именно языках "латинский" и "расширенный латинский" обслуживаются индивидуально.

Я ожидаю, что ответ будет выглядеть так:

Latin Character Set & Supported Languages:

- ..........
- ..........
- ..........

Latin-Extended Character Set & Supported Languages:

- ..........
- ..........
- ..........

Я не смог найти эту информацию в документации по Google Web Fonts или в Google.

1 ответ

Решение

латынь

aka Unicode Latin1-Supplement (от U+0080 до U+00FF) предназначен для поддержки западноевропейских языков (как вы упомянули французский, немецкий, испанский, также ирландский, исландский, языки скандинавских стран и по совпадению также других языков, упомянутых в списке ниже: британский английский пропускает обычно используемый знак £, американский английский поддерживается стандартом ASCII).

Латинская Расширенная

Латинский расширенный означает практически блокировать Latin-Extended-A (U + 0100 до U+017F), который должен поддерживать большинство латинских текстов.

Latin1-Extended-B в основном содержит поддержку латиноамериканских языков Африки, а также 3 символа для румынского и азербайджанского языков, упомянутых ниже (может быть заменен символами из расширения A).

Существуют еще более экзотические расширения C, D и E, но эти символы никогда не используются в обычных электронных текстах. Чем больше символов содержится в шрифте, тем больше его размер (шрифты, покрывающие весь BMP, могут вырасти выше 10 МБ). Следовательно, не все символы из блока Latin-Extended должны присутствовать в категории Latin-Extended, особенно в сильно стилизованных шрифтах: это зависит от назначения шрифта или мотивов его автора. Чтобы узнать, поддерживает ли шрифт определенный язык, попробуйте отобразить символы из списка ниже.

Поддержка языков

В списке ниже я не считаю:

  • орграфы, которые обычно заменяются отдельными символами (Æ поддерживается Latin1-Supplement)
  • нелатинские алфавиты, так как речь идет о латыни против латиницы
  • языки меньшинств и мертвых (эльфийский, фарерский, кашубский, черногорский, ливонский)
  • ASCII алфавиты (например, голландский или гэльский) полностью поддерживаются ASCII
  • исторические символы из рукописей

Пожалуйста, прокомментируйте, если что-то важное отсутствует или если какой-либо язык меньшинства используется в электронном общении. По умолчанию все языки нуждаются в блоке Latin-Extended-A, если примечания в списке не говорят иначе)

  • Албанский Ç, Ë (Latin1-дополнение)
  • , Ğ, I (строчные буквы без точек), İ, Ö, Ş, Ü, Ə (последний из Extended-B заменяется на Ä, затем тот же алфавит, что и турецкий)
  • Сербский, боснийский и хорватский Ć, Č, Đ, Š, Ž
  • Каталонский А, Е, Е, Я, Я, Я, Я, Ю (Латинская 1-Дополнение)
  • Чешский Á, Č, Ď, Ě, É,,, Í, Ň, Ó, Ř, Š, Ť, Ú, Ů, Ý, Ž
  • Датский, норвежский Æ, Å, Ø (Latin1-дополнение)
  • Английский £, ¢
  • Эстонский Ä, Ö, Õ, Ü, Š, Ž
  • Эсперанто Ĉ, Ĝ, Ĥ, Ĵ, Ŝ, Ŭ
  • Финский Å, Ä, Ö, Š, Ž (два последних редко используются, можно использовать S, Z, тогда достаточно Latin1-дополнение)
  • Французский Æ, Œ, Â,,,,, È, Ê, Ë, Ç, Î, Î, Ô, Ù, Û, Ü, Ÿ, "," (редко используется Œ, Ÿ из Extended-A, остальные включают Latin на латинице 1-дополнение)
  • Немецкий Ä, Ö, Ü, ß (Latin1-дополнение)
  • Венгерский Á, É, Í, Ó, Ö, Ő, Ú, Ü, Ű
  • Ирландский Á, É, Í, Ó, Latin (Latin1-дополнение)
  • Исландский Æ, Á, É, Í, Ó, Ö, Ú, Ý, Þ, Ð (дополнение Latin1)
  • Латышский Ā, Č, Ē, Ģ, Ķ, Ķ, Ī, Ļ, Ņ, Ō, Ū, Ŗ, Š, Ž
  • Литовский Ą, Č, Ę, Ė, Š, Ų, Ū, Ž
  • Польский Ą, Ć, Ę, Ł, Ń, Ó, Ś, Ź, Ż
  • Португальский Á, Â, Ã, À, Ç, É, Ê, Ó, Ô, Õ, Ú
  • Румынский Ă, Â, Î, Ș, Ț (последние 2 на латыни Extended B, можно использовать Ş, Ţ из Extended A)
  • Словацкий Ä, Á, Č, Ď, É, Í, Í, Ĺ, Ľ, Ň, Ó, Ô, Ú, Š, Ŕ, Ť, Ý, Ž
  • Сардинский Ç (Latin1-дополнение)
  • Турецкий Ç, Ğ, I (без точек), İ, Ö, Ş, Ü
  • Испанский и Галисийский С, ¿, ¡ (Latin1-Дополнение)
  • Шведский Å, Ä, Ö (Latin1-дополнение)
  • Вьетнамский Ă, Â, Đ, Ê, Ô, Ơ, Ư (+ объединение тонов 0x300 и 0x301)
  • Валлийский, Ê, Î, Ô, Û, Ŵ, Ŷ

Объединение диакритических знаков

В качестве альтернативы шрифт может поддерживать блок "Объединение диакритических меток": от U+0300 до U+036F. Например, Ř может быть напечатано либо как U + 0158 (он же предварительно скомпонованный символ), либо как R + U + 030C. Программы, поддерживающие Unicode, должны отображаться одинаково, но если программа или шрифт не поддерживают репертуар, диакритическая метка объединения может оказаться немного неуместной, см. Этот очень подробный вопрос и ответ по Unicode в этой теме.

Другие персонажи для рассмотрения

Немецкий Fraktur, все еще широко используемый (то есть на большинстве дорожных указателей в Зальцбурге), содержит символы (например, морфы "s", упомянутые в ссылке), которые не в Unicode, не имеют точного латинского аналога, и некоторые шрифты отображают их как другие персонажи. Существуют и другие экзотические символы, которые могут быть полезны в электронных текстах (когда я был ребенком, меня учили "ch" как отдельное письмо на чешском алфавите после "h". Это не в Unicode, и поскольку электронные тексты преобладали на чешском языке в середине 90-х это больше не подчеркивалось, но в чешском языке последовательность "ch" все еще отсортирована после "h", более интересная информация здесь).

Полезные шрифты с поддержкой мультиязычности

Возможно, вы захотите настроить некоторые шрифты (если это позволяет их лицензия) с помощью службы Font Squirrel. Есть широкая поддержка бесплатных шрифтов для начала:

  • Мне очень нравится красивый шрифт открытого типа Quivira с 11+k символами, 1,5 МБ
  • на многих компьютерах установлен Arial Unicode (часть MS Office, 50 000 символов, 22 МБ)
  • Существует проект Noto от Google, который содержит ВСЕ, но самые последние символы юникода в шрифтах с засечками, без засечек и в пользовательском интерфейсе, хорошо отсортированные по поддержке блоков (1,1 ГБ)
  • в качестве последнего резервного шрифта, вы можете рассмотреть уродливый Unifont (50+k символов, но только 11 МБ)
Другие вопросы по тегам