JavaScript - Unicode



什么是 Unicode?

Unicode 是一个通用的字符集,包含大多数语言、书写系统等的字符列表。它为每个字符提供一个唯一的编号,而不依赖于编程语言、平台、操作系统等。此外,它还包括标点符号、表情符号、特殊字符等。

简而言之,Unicode 集合包含唯一的数字,每个数字代表一个唯一的字符,其含义与平台、操作系统等无关。

Unicode 背后的直觉

在理解 Unicode 之前,让我们先了解其背后的理念。你能回答为什么你能阅读本教程吗?这是因为你知道所写字母的含义。读者(你)和作者对英语字母都有相同的理解;这就是你能够阅读作者所写内容的原因。

同样,计算机不理解字母。对于计算机而言,字母是位的序列,每个序列都映射到一个唯一的字符,称为 Unicode。

现在,让我们深入了解 Unicode。

JavaScript 中的 Unicode

JavaScript 允许开发人员在字符串文字和源代码中使用 Unicode 字符。开发人员需要使用转义表示法 (\u) 来在 JavaScript 代码中使用 Unicode 字符。

语法

用户可以按照以下语法在 JavaScript 中使用 Unicode 字符。

const char = '\uxxxx';

在上述语法中,'\uxxxx' 是一个 Unicode 字符。“xxxx”代表十六进制字符,“\u”代表转义表示法。

示例

示例:Unicode 转义序列

在下面的示例中,我们使用了 Unicode 转义序列来打印“hello”消息。

<html>
<body>
   <div>Using unicode escape sequence</div>
   <div id = "output"> </div>
   <script>
      let str = '\u0068\u0065\u006c\u006c\u006f'
      document.getElementById("output").innerHTML = str;
</script>
</body>
</html>

输出

Using unicode escape sequence
hello

示例:在变量名中使用 Unicode 字符

在下面的代码中,我们使用了两个不同的 Unicode 字符作为两个不同的标识符(变量名)。在输出中,您可以观察到这两个标识符的值。

<html>
<body>
   <div>Using unicode characters in variable names</div>
   <div id = "output"> </div>
   <script>
      // Using the Unicode characters in variable names
      let \u0061 = "Hello";
      let \u0062 = "World";
      document.getElementById("output").innerHTML = a + " " + b;
</script>
</body>
</html>

输出

Using unicode characters in variable names
Hello World

示例:在字符串中使用 Unicode 字符

在这个示例中,我们在字符串文字中使用了 Unicode 字符。输出显示字符串中间的特殊字符。

<html>
<body>
   <div> Using the Unicode Characters in String </div>
   <div id = "output"> </div>
   <script>
    // Using the Unicode characters in the string
    let str = 'Hello \u00D8 \u00F8 World';
    document.getElementById("output").innerHTML = str;
</script>
</body>
</html>

输出

Using the Unicode Characters in String
Hello Ø ø World

示例:为非 BMP(基本多语言平面)字符使用 Unicode

在下面的示例中,我们使用了 Unicode 字符(代码点)来显示非 BMP(基本多语言平面)字符。我们为一名医护人员进行了演示。

<html>
<body>
   <div>showing person heath worker using unicode code point</div>
   <div id = "output"> </div>
   <script>
    // Showing emojis using the unicode characters
    const smileyFace = '\u{1F9D1}\u200D\u2695\uFE0F';
    document.getElementById("output").innerHTML = smileyFace;
</script>
</body>
</html>

输出

showing person heath worker using unicode code point
🧑‍⚕️

示例:使用 Unicode 字符显示表情符号

在下面的代码中,我们使用了Unicode字符来显示笑脸表情符号。

<html>
<body>
   <div>Showing Emojies Using the Unicode Characters </div>
   <div id = "output"> </div>
   <script>
    // Showing emojis using the unicode characters
    const smileyFace = '\uD83D\uDE0A';
    document.getElementById("output").innerHTML = smileyFace;
</script>
</body>
</html>

输出

Showing Emojies Using the Unicode Characters
😊

正如我们所看到的,每个Unicode字符都代表一个唯一的字符。在JavaScript中,我们可以使用带标识符、字符串字面量等的Unicode字符。

广告