XML - 编码



编码即将 Unicode 字符转换为其等效的二进制表示的过程。XML 处理器在读取 XML 文档时,它会根据编码类型对文档进行编码。因此,我们需在 XML 声明中指定编码类型。

编码类型

编码类型主要有两种 -

  • UTF-8
  • UTF-16

UTF 表示UCS 转换格式,而 UCS 本身表示通用字符集。数字 8 或 16 表示用于表示字符的位数。它们为 8(1 至 4 个字节)或 16(2 或 4 个字节)。对于没有编码信息的文档,默认情况下会设置 UTF-8。

语法

编码类型包含在 XML 文档的前言中。UTF-8 编码的语法如下 -

<?xml version = "1.0" encoding = "UTF-8" standalone = "no" ?>

UTF-16 编码的语法如下 -

<?xml version = "1.0" encoding = "UTF-16" standalone = "no" ?>

示例

以下示例显示编码的声明 -

<?xml version = "1.0" encoding = "UTF-8" standalone = "no" ?>
<contact-info>
   <name>Tanmay Patil</name>
   <company>TutorialsPoint</company>
   <phone>(011) 123-4567</phone>
</contact-info>

在上述示例中,encoding="UTF-8" 指明使用 8 位来表示字符。要表示 16 位字符,可以使用 UTF-16 编码。

使用 UTF-8 编码的 XML 文件往往比使用 UTF-16 格式编码的文件要小。

广告