XML 字符实体



本章描述了 XML **字符实体**。在理解字符实体之前,让我们首先了解什么是 XML 实体。

正如 W3C 联盟 所述,实体的定义如下:

“文档实体作为实体树的根和 XML 处理器的起点”。

这意味着实体是 XML 中的占位符。这些可以在文档序言或 DTD 中声明。有不同类型的实体,本章将讨论字符实体。

HTML 和 XML 都有一些为其自身用途保留的符号,这些符号不能用作 XML 代码中的内容。例如,**<** 和 **>** 符号用于打开和关闭 XML 标签。要显示这些特殊字符,可以使用字符实体。

有一些特殊字符或符号无法直接从键盘输入。字符实体也可用于显示这些符号/特殊字符。

字符实体的类型

字符实体有三种类型:

  • 预定义字符实体
  • 编号字符实体
  • 命名字符实体

预定义字符实体

引入它们是为了避免在使用某些符号时出现歧义。例如,当小于 (**<**) 或大于 (**>**) 符号与角标签 (**<>**) 一起使用时,会观察到歧义。字符实体基本上用于在 XML 中分隔标签。以下是 XML 规范中预定义字符实体的列表。这些可以用来表达字符而不会产生歧义。

  • 和号 − **&amp;**

  • 单引号 − **&apos;**

  • 大于号 − **&gt;**

  • 小于号 − **&lt;**

  • 双引号 − **&quot;**

数字字符实体

数字引用用于引用字符实体。数字引用可以是十进制或十六进制格式。由于有数千个可用的数字引用,这些数字有点难以记住。数字引用通过其在 Unicode 字符集中的编号来指代字符。

十进制数字引用的通用语法为:

&# decimal number ;

十六进制数字引用的通用语法为:

&#x Hexadecimal number ;

下表列出了一些预定义的字符实体及其数值:

实体名称 字符 十进制引用 十六进制引用
quot " &#34; &#x22;
amp & &#38; &#x26;
apos ' &#39; &#x27;
lt < &#60; &#x3C;
gt > &#62; &#x3E;

命名字符实体

由于很难记住数字字符,因此最常用的字符实体类型是命名字符实体。在这里,每个实体都用一个名称标识。

例如:

  • “Aacute”代表带重音符的大写字符。

  • “ugrave”代表带重音符的小写字符。

广告