信息安全中的文本隐写术是什么?
文本隐写术是一种将秘密文本消息隐藏在另一个文本(作为掩盖消息)中的方法,或者创建与初始秘密消息相关联的掩盖消息。
文本隐写术可以包括任何内容,从转换现有文本的格式,到更改文本中的单词,到生成随机字符序列或利用上下文无关语法来创建可读文本。
文本隐写术被认为是最棘手的,因为缺乏图像、音频或视频文件中存在的冗余数据。文本文档的机制与其可以识别的内容相同,而在其他类型的文档(包括图片)中,文档的结构与其可以识别的内容不同。
因此,在这些文档中,它可以通过学习文档结构的变化来隐藏信息,而不会在相关的输出中产生明显的更改。
可以在图像或音频文件中创建不可感知的更改,但是,在文本文件中,即使是额外的字母或标点符号也可能被普通读者注意到。它可以节省文本文件所需的内存,并且速度更快,以及更简单的通信,使其优于其他类型的隐写术方法。
文本隐写术通常可以分为三种类型,包括基于格式的随机和统计生成、语言学方法,如下所示:
基于格式的方法 - 基于格式的方法包括物理更改文本的格式以隐藏数据。此方法存在特定的缺陷。如果使用文字处理器打开隐写文件,拼写错误和额外的空格将被识别。
更改字体大小可能会引起人类读者的怀疑。此外,如果初始纯文本可用,将此纯文本与可疑的隐写文本进行比较,可以使文本的操纵元素变得非常明显。
随机和统计生成 - 在随机和统计生成中,它可以防止与已知的纯文本相对应,隐写者提供创建自己的掩盖文本的途径。一种方法是隐藏随机查看字符序列中的数据。
在另一种方法中,单词长度和字母频率的统计特征用于生成看起来具有与给定语言中实际单词相似的统计属性的单词。
语言学隐写术 - 语言学隐写术特别考虑了生成和更改文本的语言学属性,在某些情况下,使用语言学机制作为隐藏消息的空间。
CFG 可以创建树结构,可用于隐藏位,其中左分支定义“0”,右分支对应于“1”。
还可以使用 GNF 中的语法,其中生成中的第一个选择定义位 0,第二个选择定义位 1。此方法有一些缺点。首先,小型语法会导致多次文本重复。
其次,尽管文本在语法上完美无缺,但存在语义结构的缺点。结果是一系列彼此之间没有任何关联的句子。