在 Java 中,Unicode、ASCII、UTF-16 和 UTF-8 字符分别使用多少位来表示?


一般来说,数据以位的形式(1 或 0)存储在计算机中。有各种可用的编码方案,指定每个字符表示的字节集。

ASCII - 代表**A**merican **S**tandards **C**ode for **I**nformation **I**nterchange(美国信息交换标准代码)。它由美国标准协会开发,是最常用的编码系统。它使用 7 位表示字符,包含 128 个字符:大小写拉丁字母、数字 0-9 和一些额外字符)。

Unicode (UTF) - 代表 Unicode 转换格式。它由 Unicode Consortium 开发。如果您想创建使用多个字符集的字符的文档,则可以使用单个 Unicode 字符编码来实现。它提供 3 种类型的编码。

  • UTF-8 - 它以 8 位单位(字节)出现,UTF8 中的一个字符可以是 1 到 4 个字节长,这使得 UTF8 成为可变宽度。
  • UTF-16 - 它以 16 位单位(短整型)出现,它可以是 1 或 2 个短整型长,这使得 UTF16 成为可变宽度。
  • UTF-32 - 它以 32 位单位(长整型)出现。它是一种固定宽度格式,长度始终为 1 个“长整型”。

Java 中的表示

下表列出了 Java 中用于表示各种编码标准的位数。

表示使用的位数
ASCII7 位(表示为 8 位)。
UTF-88 位、16 位和 18 位模式。
UTF-1616 位和更大的位模式。

更新于: 2019-07-30

2K+ 阅读量

开启您的职业生涯

通过完成课程获得认证

开始学习
广告