ANSI和ASCII的区别


文本由单个字符组成,这些字符组合成单词和句子。为特定目的所需的字符被分组到字符集中。每个字符都分配一个编号,称为代码点,以便在引用字符时不会产生歧义。

计算机根据字符的大小将每个字符保存为一个或多个字节。如果您假设计算机中的每个字符都由一个唯一的代码表示,类似于用于转换通信的密码,那么您可以大致了解其工作原理。字符编码充当可用于解密代码的密钥。它是一组计算机中的字节和字符集中的字符之间的映射。没有密钥,数据看起来就像垃圾。

当您使用键盘或任何其他方法将文本输入到计算机时,字符编码首先将您选择的字符映射到计算机内存中的特定字节。为了显示文本,计算机然后读取这些字节并将它们转换回字符。

通俗地说,“字符编码”是一种指示计算机如何将原始的零和一解释为实际字符的方法。这是基于每个字符都由一组唯一的数字表示的。

目前,有大量不同版本的字符编码在流通。ANSI和ASCII都是存在了很长时间但仍然常用的字符编码技术。尽管大多数人认为这两个系统是等价的,但实际上并非如此。

什么是ANSI?

美国国家标准学会 (ANSI) 代码是由美国国家标准学会发布的标准化数字或字母标识符,用于在所有联邦政府部门中统一识别地理实体。这些代码可以在 ANSI 文档中找到。它是给定操作系统(如 Windows)的默认代码页的通用术语。

90多年来,它一直担任美国私营部门和自愿标准化体系协调者的角色。从某种意义上说,这实际上是对 ASCII 字符集的扩展,因为它除了这些字符之外,还具有所有 ASCII 字符以及 128 个字符代码。

美国信息交换标准代码 (ASCII) 不过是对包含 128 个符号并使用 7 位的代码页的定义。ANSI 标准将其扩展到 8 位,并且对于符号 128 到 255,有多个单独的代码页。

1985年,Microsoft Windows 首次发布,其中已安装 ANSI 字符集。ANSI 代码页格式是 Windows ME 中使用的主要格式。它们也与 Windows NT 操作系统兼容。在 Windows/U.S. 上运行时,它被称为 Windows-1252。此外,ANSI 编码格式是 Notepad++ 中默认使用的格式。拉丁字母的编码通常以这种方式完成。Unix 和 MS-DOS 都是基于 ANSI 的流行软件的示例。

什么是ASCII?

ASCII(美国信息交换标准代码)是一种字符编码技术,是第一个字符编码标准。它是一种将英文字符表示为数字的代码,每个字母都分配一个从 0 到 127 的数字作为其在代码中的表示。

有 95 个可打印字符构成编码文本。这些可打印字符包括数字 0 到 9、小写字母“a”到“z”、大写字母“A”到“Z”以及各种标点符号。此外,ASCII 的第一个规范包括 33 个非打印控制代码,这些代码源自电传打字机。大多数这些非打印控制代码已不再使用,但少数几个,例如回车、换行和制表符代码,仍在广泛使用。

尽管大多数现代字符编码方法都源自 ASCII,但它们支持更广泛的字符。它是一种仅使用单个字节的最低 7 位的编码。ASCII 文件中的每个字母字符、数字字符和特殊字符都由一个 7 位长的二进制整数表示。

无论我们是否习惯使用普通键盘,我们键入时始终使用 ASCII 代码。绝大多数情况下,使用数字 ASCII 代码来识别在键盘上键入的每个字母。电子邮件的传输、文本文件的创建、视觉艺术、计算机语言 C 和其他应用程序都使用 ASCII 字符。基于 UNIX 或 Windows 的操作系统也使用一种转换为和从 ASCII 转换的机制。

ANSI和ASCII的区别

两种编码标准之间的主要区别在于 ANSI 或 ASCII 可以表示的最大字符数。在与 Microsoft 相关的 ANSI 编码系统中,每个字符都使用 8 位模式。另一方面,ASCII 字符编码技术通过 7 位长的唯一二进制数字识别每个字符。因此,ASCII 代码可用于指定总共 128 个不同的字符。

ASCII 最初设计时仅使用 7 位,导致总共有 128 种不同的字符组合。它是专门为英语设计的,测试表明它能够存储所有字母、数字、特殊字符、符号和未打印的字符。

美国国家标准学会 (ANSI) 负责维护一个称为 ANSI 的标准代码页,该代码页由 Windows 等操作系统使用。这是一种与 Microsoft 相关的编码方法。它为字母表中的每个字母使用 8 位序列。但是,由于 Microsoft 拥有悠久而辉煌的历史,因此这个名称仍然适用。尽管 ANSI 是一种灵活的编码方法,但 ASCII 仍然是主要的字符编码形式。

ANSI 包含所有必要的绘图符号,而 ASCII 仅包含数字表示。

下表重点介绍了 ANSI 和 ASCII 之间的主要区别 -

比较依据
ANSI
ASCII
全称
美国国家标准学会
美国信息交换标准代码
字符表示
256个字符
128个字符
位使用
它使用8位
它使用7位
生命周期
它具有较短的生命周期
它具有较长的生命周期
一致性
在系统范围内,它们并不相同。
每个系统使用的 ASCII 代码点完全相同。
复杂度
它不简单易用。
它简单易用。
标准化


结论

Unicode 比 ASCII 或 ANSI 都更完整,已经取代了这两种较旧的编码标准。在这种情况下,ANSI 和 ASCII 之间的主要区别在于能够进行向后兼容性检查。

ANSI 是 ASCII 的超集,它扩展并改进了 ASCII 编码系统。ANSI 字符集是为了规避 ASCII 字符集的限制而开发的;但是,此尝试最终失败,ANSI 字符集最终被停用。

尽管如此,ASCII 代码在世界各地的键盘上都使用,因为它们提供了一种通用且标准的语言。这种语言是英语。因此,程序员和任何设计软件的人通常都选择 ASCII,因为它易于理解。

更新于:2022年7月5日

8K+浏览量

开启你的职业生涯

完成课程获得认证

立即开始
广告