Как JavaScript гарантирует, что программы написаны с использованием набора символов Unicode?

Я нашел это предложение, читая одну из книг по JavaScript:

Программы на JavaScript написаны с использованием набора символов Unicode

Что я не понимаю, так это то, как файлы JavaScript гарантируют, что все, что я пишу в .js файл, будет набор символов Unicode?

Означает ли это, что когда я печатаю с помощью клавиатуры на моем компьютере, он всегда использует Unicode? Как это работает?

1 ответ

Решение

Это означает, что определение языка использует кодировку Unicode. В частности, это обычно означает, что строковые литералы могут включать символы Unicode, а также могут означать, что идентификаторы также могут включать некоторые символы Unicode (я не знаю JavaScript, но, в частности, это разрешено на языке Haskell).

Теперь реализация JavaScript может выбрать любой способ отображения байтов в файле.js во внутреннее представление Unicode. Он может делать вид, что все файлы.js записаны в UTF-8, или в 7-битной кодировке ASCII, или во что-то еще. Вы должны обратиться к руководству по внедрению, чтобы раскрыть это.

И да, вам нужно знать, что любой файл состоит из байтов, а не символов. То, как символы, которые вы набираете в редакторе, преобразуется в байты, хранящиеся в файле, зависит от вашего редактора (обычно он обеспечивает выбор между использованием локальных 8-битных кодировок, UTF-8 и иногда UTF-16). Как байты, хранящиеся в файле, преобразуются в символы, зависит от вашей языковой реализации (в данном случае, JavaScript).

Другие вопросы по тегам