在 Java 中,Unicode、ASCII、UTF-16 和 UTF-8 字符分别使用多少位来表示?
一般来说,数据以位的形式(1 或 0)存储在计算机中。有各种可用的编码方案,指定每个字符表示的字节集。
ASCII - 代表**A**merican **S**tandards **C**ode for **I**nformation **I**nterchange(美国信息交换标准代码)。它由美国标准协会开发,是最常用的编码系统。它使用 7 位表示字符,包含 128 个字符:大小写拉丁字母、数字 0-9 和一些额外字符)。
Unicode (UTF) - 代表 Unicode 转换格式。它由 Unicode Consortium 开发。如果您想创建使用多个字符集的字符的文档,则可以使用单个 Unicode 字符编码来实现。它提供 3 种类型的编码。
- UTF-8 - 它以 8 位单位(字节)出现,UTF8 中的一个字符可以是 1 到 4 个字节长,这使得 UTF8 成为可变宽度。
- UTF-16 - 它以 16 位单位(短整型)出现,它可以是 1 或 2 个短整型长,这使得 UTF16 成为可变宽度。
- UTF-32 - 它以 32 位单位(长整型)出现。它是一种固定宽度格式,长度始终为 1 个“长整型”。
Java 中的表示
下表列出了 Java 中用于表示各种编码标准的位数。
表示 | 使用的位数 |
---|---|
ASCII | 7 位(表示为 8 位)。 |
UTF-8 | 8 位、16 位和 18 位模式。 |
UTF-16 | 16 位和更大的位模式。 |
广告