生物识别 - 快速指南
生物识别概述
术语“生物识别”由两个词组成 - Bio(希腊语,意为生命)和Metrics(测量)。生物识别是信息技术的一个分支,旨在根据个人特征确定其身份。
生物识别目前是信息安全领域的一个热门话题,因为它在识别个人方面提供了高度的准确性。
什么是生物识别?
生物识别是一种用于识别、分析和测量个人生理和行为特征的技术。
每个人的特征都是独一无二的,这使得他或她与其他人有所不同。诸如指纹、虹膜颜色、头发颜色、手部几何形状等生理特征,以及诸如语音的音调和口音、签名或打字方式等行为特征,使一个人与其他人区别开来。
然后,生物识别系统利用人的这种独特性来 -
- 识别和验证一个人。
- 对一个人进行身份验证,以赋予其相应的系统操作权限。
- 确保系统免受不道德的操作。
什么是生物识别系统?
生物识别系统是一种技术,它将个人的生理特征、行为特征或两者兼而有之作为输入,对其进行分析,并识别该个人是合法用户还是恶意用户。
生物识别的发展
生物识别的理念由来已久。14世纪,中国开始对商人及其子女进行指纹采集,以将其与其他人区分开来。指纹识别至今仍在使用。
在19世纪,一位名叫阿尔丰斯·贝蒂隆的人类学家开发了一种(名为贝蒂隆法)人体测量方法来识别个人。他意识到,即使人体的一些特征发生了变化,例如头发长度、体重等,但一些身体特征却保持不变,例如手指长度。这种方法很快就被淘汰,因为它发现仅凭相同的人体测量数据就能将不同的人错误地认作同一人。随后,苏格兰场警署的理查德·爱德华·亨利开发了一种指纹识别方法。
视网膜识别理念由卡尔顿·西蒙博士和艾萨多尔·戈德斯坦博士于1935年提出。1976年,EyeDentify公司开展了研发工作。第一个商用视网膜扫描系统于1981年推出。
虹膜识别由约翰·道格曼于1993年在剑桥大学发明。
2001年,科索沃引入了生物识别自动化工具集(BAT),提供了一种可靠的身份识别手段。
如今,生物识别已发展成为一个独立的学科,拥有建立个人身份的精确技术。
为什么要使用生物识别?
随着信息技术在银行业、科学、医疗等领域的应用日益广泛,迫切需要保护系统和数据免受未经授权的用户访问。
生物识别用于身份验证和授权个人。尽管这两个术语经常一起使用,但它们的含义不同。
身份验证(识别)
此过程试图找到“您是否就是您声称的那个人?”或“我认识您吗?”问题的答案。这是一对多匹配,将一个人的生物识别信息与整个数据库进行比较。
验证
这是一个一对一的匹配过程,其中候选人输入的实时样本与数据库中先前存储的模板进行比较。如果两者匹配度超过70%的相似度,则验证成功。
授权
这是向经过身份验证或验证的用户分配访问权限的过程。它试图找到“您是否有资格访问此资源的某些权限?”问题的答案。
传统安全辅助手段的不足
传统的信息系统安全方法使用身份证、密码、个人识别号码(PIN)等。它们存在以下缺点 -
它们都意味着识别与个人相关联的某些代码,而不是识别实际生成该代码的人。
- 它们可能被遗忘、丢失或被盗。
- 它们可能被绕过或轻易被破坏。
- 它们不精确。
在这种情况下,系统的安全性受到威胁。当系统需要高度可靠的保护时,生物识别通过将身份与个人更紧密地绑定起来提供帮助。
生物识别系统的基本组成部分
一般来说,生物识别系统可以分为四个基本组成部分。让我们简要了解一下 -
输入接口(传感器)
它是生物识别系统中的传感组件,它将人类生物数据转换为数字形式。
例如,
在人脸识别、手印识别或虹膜/视网膜识别系统中使用金属氧化物半导体(CMOS)图像传感器或电荷耦合器件(CCD)。
- 在指纹识别系统中使用光学传感器。
- 在语音识别系统中使用麦克风。
处理单元
处理组件是微处理器、数字信号处理器(DSP)或计算机,用于处理从传感器捕获的数据。
生物识别样本的处理涉及 -
- 样本图像增强
- 样本图像归一化
- 特征提取
- 将生物识别样本与数据库中所有存储的样本进行比较。
数据库存储
数据库存储已注册的样本,并在身份验证时将其调出以进行匹配。对于识别,可以使用从随机存取存储器(RAM)、闪存EPROM或数据服务器等任何存储器。对于验证,使用可移动存储元件,例如接触式或非接触式智能卡。
输出接口
输出接口将生物识别系统的决策传达给用户,以允许其访问。这可以是简单的串行通信协议RS232,或更高带宽的USB协议。它也可以是TCP/IP协议、射频识别(RFID)、蓝牙或众多蜂窝协议之一。
生物识别系统的一般工作原理
生物识别系统执行识别和验证通常需要四个步骤 -
- 获取候选人的实时样本。(使用传感器)
- 从样本中提取突出特征。(使用处理单元)
- 将实时样本与数据库中存储的样本进行比较。(使用算法)
- 呈现决策。(接受或拒绝候选人。)
从候选用户那里获取生物识别样本。从样本中提取突出特征,然后将其与数据库中存储的所有样本进行比较。当输入样本与数据库中的某个样本匹配时,生物识别系统允许该人员访问资源;否则禁止访问。
生物识别术语
生物识别模板 - 它是从生物识别样本中提取的独特特征的数字参考。
候选人/主体 - 输入其生物识别样本的人。
闭集识别 - 已知该人在数据库中存在。
注册 - 当候选人第一次使用生物识别系统时,它会记录基本信息,例如姓名、地址等,然后记录候选人的生物识别特征。
错误接受率(FAR) - 它是衡量生物识别系统错误地将未经授权的用户识别为有效用户的可能性。
提供低FAR的生物识别系统确保了高安全性。
错误拒绝率(FRR) - 它是衡量生物识别系统错误地将授权用户拒绝为无效用户的可能性。
开集识别 - 该人并不保证存在于数据库中。
任务 - 当生物识别系统搜索数据库以查找匹配的样本时。
生物识别的应用领域
生物识别系统在许多应用中都非常有用。以下列出了一些 -
- 控制工作场所访问。
为身份认证和移民系统建立人员身份。
- 对敏感信息和系统应用访问控制。
- 通过法医识别罪犯。
- 执行在线电子商务交易。
- 减少欺诈和盗窃。
- 执法。
生物识别模式
生物识别模式只不过是生物识别系统的一类,它取决于作为输入的人类特征的类型。
生物识别在很大程度上是统计性的。样本数据越多,系统越有可能独一无二且可靠。它可以处理与个人身体和特征测量以及行为模式相关的各种模式。这些模式是根据个人的生物特征进行分类的。
生物识别模式的类型
人类存在各种特征,可以作为生物识别模式。生物识别模式分为三种类型 -
- 生理特征
- 行为特征
- 生理和行为特征的结合
下表总结了这三种模态之间的区别 -
生理模态 | 行为模态 | 两种模态的结合 |
---|---|---|
这种模态与身体的形状和大小有关。 | 这种模态与人类行为随时间的变化有关。 | 这种模态包含两种特征,其中特征取决于身体和行为的变化。 |
例如 -
|
例如 -
|
例如 - 语音识别 它取决于声带、鼻腔、口腔、嘴唇形状等的健康、大小和形状,以及一个人的情绪状态、年龄、疾病(行为)。 |
在后续章节中,我们将更详细地讨论这些模态中的每一个。
生理模式
如前所述,生理模态基于对人体部分(如虹膜、指纹、手指的形状和位置等)的直接测量。
有些身体特征在人的一生中保持不变。它们可以成为识别个体的极佳资源。
指纹识别系统
它是生物识别系统中最知名和最常用的生物识别解决方案,用于对人员进行身份验证。它之所以如此受欢迎的原因在于,它有十种可用的生物识别来源,并且易于获取。
每个人都有独特的指纹,它由脊、沟和线条的方向组成。脊的基本模式有三种,即弓形、环形和螺旋形。指纹的唯一性由这些特征以及细节特征(如分叉和点(脊端))决定。
指纹是最古老、最流行的识别技术之一。指纹匹配技术分为三种 -
基于细节特征的技术 - 在这些技术中,会找到细节特征点,然后将其映射到手指上的相对位置。存在一些困难,例如,如果图像质量较低,则难以正确找到细节特征点。另一个困难是,它考虑的是脊和沟的局部位置;而不是全局的。
基于相关性的方法 - 它使用更丰富的灰度信息。它通过能够处理劣质数据来克服基于细节特征的方法的问题。但它也有一些自身的问题,如点的定位。
基于模式(基于图像)的匹配 - 基于模式的算法比较存储模板和候选指纹之间的基本指纹模式(弓形、螺旋形和环形)。
指纹识别系统的优点
- 它是目前最先进的方法。
- 它是最经济的方法。
- 它高度可靠且安全。
- 它使用小型模板,从而加快了验证过程。
- 它消耗的内存空间更少。
指纹识别系统的缺点
- 疤痕、割伤或手指缺失会妨碍识别过程。
- 系统可能会被使用蜡制成的人造指纹欺骗。
- 它涉及与系统的物理接触。
- 他们在输入样本时会留下手指的图案。
指纹识别系统的应用
- 验证驾驶执照的真实性。
- 检查驾驶执照的有效性。
- 边境控制/签证签发。
- 组织中的访问控制。
人脸识别系统
人脸识别基于确定下巴、下颌的形状和大小、眼睛、眉毛、鼻子、嘴唇和颧骨的形状和位置。二维面部扫描仪开始读取面部几何形状并在网格上记录它。面部几何形状以点的形式传输到数据库。比较算法执行面部匹配并得出结果。人脸识别以以下方式执行 -
面部测量 - 在这种类型中,测量瞳孔之间的距离或从鼻子到嘴唇或下巴的距离。
特征脸 - 它是将整个面部图像分析为若干面部的加权组合的过程。
皮肤纹理分析 - 定位一个人皮肤上独特的线条、图案和斑点。
人脸识别系统的优点
- 它可以轻松地将模板存储在数据库中。
- 它降低了识别面部图像的统计复杂度。
- 它不涉及与系统的物理接触。
人脸识别系统的缺点
- 面部特征会随着时间推移而改变。
- 无法保证唯一性,例如,在同卵双胞胎的情况下。
如果候选人的面部表情有所不同,例如轻微微笑,则会影响结果。
- 它需要充足的光线才能获得正确的输入。
人脸识别系统的应用
- 通用身份验证。
- 访问控制验证。
- 人机交互。
- 犯罪识别。
- 监控。
虹膜识别系统
虹膜识别基于人眼中的虹膜图案。虹膜是色素化的弹性组织,中心有一个可调节的圆形开口。它控制瞳孔的直径。在成年人中,虹膜的纹理在他们的整个生命中都是稳定的。左右眼的虹膜图案不同。虹膜图案和颜色因人而异。
它涉及使用能够拍摄虹膜照片的相机拍摄虹膜照片,将其存储起来,并使用数学算法将其与候选人的眼睛进行比较。
虹膜识别系统的优点
它非常准确,因为两个虹膜匹配的几率是十亿分之一。
它具有很强的可扩展性,因为虹膜图案在人的一生中保持不变。
候选人无需摘掉眼镜或隐形眼镜;它们不会影响系统的准确性。
它不涉及与系统的物理接触。
由于模板尺寸小,它可以提供即时验证(2到5秒)。
虹膜识别系统的缺点
- 虹膜扫描仪价格昂贵。
- 高质量的图像可能会欺骗扫描仪。
- 为了进行准确扫描,需要保持头部不动。
虹膜识别系统的应用
国家安全和身份证件,例如印度的Aadhaar卡。
谷歌使用虹膜识别来访问其数据中心。
手部几何识别系统
它包括测量手掌的长度和宽度、表面积、手指的长度和位置以及手的整体骨骼结构。每个人的手都是独一无二的,可以用来将一个人与其他人区分开来。手部几何系统有两种 -
接触式 - 将手放在扫描仪的表面上。该放置位置由五个销钉定位,这些销钉引导候选人的手正确放置在相机前。
非接触式 - 在这种方法中,获取手部图像不需要销钉或平台。
手部几何识别系统的优点
- 它坚固耐用且用户友好。
- 皮肤水分或纹理的变化不会影响结果。
手部几何识别系统的缺点
- 由于手部几何形状不是唯一的,因此它不太可靠。
- 它对成年人有效,而对正在长大的儿童则无效。
如果候选人的手上戴着珠宝、石膏或患有关节炎,则可能会出现问题。
手部几何识别系统的应用
核电站和军队使用手部几何识别进行访问控制。
视网膜扫描系统
视网膜是眼球后部的衬里层,覆盖了眼球内表面65%。它包含感光细胞。由于供应血液的复杂血管网络,每个人的视网膜都是独一无二的。
它是一种可靠的生物识别技术,因为视网膜图案在人的一生中保持不变,除非患有糖尿病、青光眼或某些退行性疾病的人除外。
在视网膜扫描过程中,会要求一个人摘掉隐形眼镜或眼镜。将低强度红外光束照射到一个人的眼睛中 10 到 15 秒。在扫描过程中,红外光会被血管吸收,形成血管图案。然后将此图案数字化并存储在数据库中。
视网膜扫描系统的优点
- 它无法伪造。
它非常可靠,因为错误率是一千万个样本中出现一次(几乎为0%)。
视网膜扫描系统的缺点
它不是非常用户友好,因为用户需要保持稳定,这可能会导致不适。
它往往会揭示一些不良的健康状况,如高血压或糖尿病,从而导致隐私问题。
结果的准确性容易受到白内障、青光眼、糖尿病等疾病的影响。
视网膜扫描系统的应用
- 一些政府机构(如 CID、FBI 等)在实践中使用它。
除了安全应用外,它还用于眼科诊断。
DNA识别系统
脱氧核糖核酸(DNA)是存在于人类体内的遗传物质。除了同卵双胞胎外,每个人都可以通过其DNA中发现的特征来唯一地识别,这些特征位于细胞核中。可以从许多来源收集DNA模式,例如血液、唾液、指甲、头发等。
在细胞内,DNA以称为染色体的长双螺旋结构组织。人类有23对染色体。在总共46条染色体中,后代从每个生物学父母那里继承23条染色体。后代99.7%的DNA与父母共享。其余0.3%的DNA包含对个体而言唯一的重复编码。
DNA分析的基本步骤如下 -
从血液、唾液、头发、精液或组织等任何一种来源获得的样本中分离DNA。
将DNA样本分离成较短的片段。
根据大小整理DNA片段。
比较来自不同样本的DNA片段。
样本越详细,比较就越精确,从而越能识别出个人。
DNA生物识别与所有其他生物识别技术的不同之处在于 -
它需要有形的物理样本,而不是图像。
DNA匹配是在物理样本上进行的。没有特征提取或模板保存。
DNA识别系统的优点
它提供了最高的准确性。
DNA识别系统的缺点
- 从样本采集到结果的程序时间较长。
- 由于信息量更大,它带来了隐私问题。
- 它需要更多的存储空间。
- 样本污染或样本降解可能会影响结果。
DNA识别系统的应用
- 它主要用于证明有罪或无罪。
- 它用于物理和网络安全。
行为模式
行为生物识别与人们表现出的行为或人们执行任务的方式(例如行走、签名和在键盘上打字)有关。
行为生物识别模态的变化较大,因为它们主要取决于疲劳、情绪等外部因素。与基于生理生物识别的解决方案相比,这会导致更高的错误接受率和错误拒绝率。
步态识别
步态是一个人行走的方式。人们在行走时表现出不同的特征,例如身体姿势、行走时两脚之间的距离、摇摆等,这些特征有助于唯一地识别他们。
步态识别基于分析候选人行走时的视频图像。候选人行走周期的样本通过视频记录。然后分析样本中关节(如膝盖和脚踝)的位置以及行走时关节之间形成的角度。
为每个候选人创建相应的数学模型并将其存储在数据库中。在验证时,将此模型与候选人行走时的实时样本进行比较,以确定其身份。
步态识别系统的优点
它是非侵入性的。
它不需要候选人的配合,因为它可以从远处使用。
它可以用于通过发现帕金森病患者步态模式的变化来确定医学疾病。
步态识别系统的缺点
对于这种生物识别技术,至今还没有开发出完全准确的模型。
它可能不如其他已建立的生物识别技术可靠。
步态识别系统的应用
它非常适合在犯罪场景中识别罪犯。
签名识别系统
在这种情况下,更多地强调的是签名的行为模式,而不是签名在图形方面的外观。
行为模式包括书写时间的变化、停顿、压力、笔划方向和签名过程中的速度。复制签名的图形外观可能很容易,但很难模仿人在签名时表现出的相同行为。
这项技术包括一支笔和一个专门的书写板,两者都连接到计算机上进行模板比较和验证。高质量的平板电脑可以捕捉行为特征,例如签名时的速度、压力和时间。
在注册阶段,候选人必须在书写板上多次签名以获取数据。然后,签名识别算法提取独特的特征,例如时间、压力、速度、笔划方向、签名路径上的重要点以及签名的尺寸。该算法为这些点分配不同的权重值。
在识别时,候选人输入签名的实时样本,并将其与数据库中的签名进行比较。
签名识别系统的限制
为了获取足够数量的数据,签名应该足够小以适合平板电脑,并且足够大以能够处理。
书写板的质量决定了签名识别注册模板的稳健性。
候选人必须在与注册时相同的环境和条件下执行验证过程。如果发生变化,则注册模板和实时样本模板可能彼此不同。
签名识别系统的优点
签名识别过程对冒充者具有很强的抵抗力,因为很难模仿与签名相关的行为模式。
它在大量商业交易中运行良好。例如,签名识别可用于在打开和签署任何机密文件之前,积极验证参与交易的业务代表。
- 它是一种非侵入性工具。
我们都在某种商业活动中使用我们的签名,因此实际上不存在任何隐私权问题。
即使系统被黑客入侵且模板被盗,也易于恢复模板。
签名识别系统的缺点
实时样本模板容易随着签名行为的变化而变化。例如,用石膏固定住的手签名。
用户需要习惯使用签名板。在习惯之前,错误率很高。
签名识别系统的应用
- 它用于文档验证和授权。
芝加哥的摩根大通银行是首家采用签名识别技术的银行。
击键识别系统
在二战期间,军事情报部门使用了一种称为“发送者之拳”的技术来确定莫尔斯电码是敌方还是盟友发送的,其依据是打字的节奏。如今,击键动态是硬件方面最易于实施的生物识别解决方案。
这种生物识别技术分析候选人的打字模式、节奏和在键盘上的打字速度。击键识别中使用**驻留时间**和**飞行时间**测量。
**驻留时间** - 它是按下某个键持续的时间。
**飞行时间** - 它是释放一个键和按下下一个键之间的时间。
候选人在键盘上的打字方式不同,因为他们找到正确键的时间、飞行时间和驻留时间都不同。他们的打字速度和节奏也根据他们对键盘的舒适程度而有所不同。击键识别系统以每秒数千次的速度监控键盘输入,以一次尝试根据用户的打字习惯识别用户。
击键识别有两种类型:
**静态** - 这是在交互开始时的一次性识别。
**连续** - 这是在整个交互过程中。
击键动态的应用
击键识别用于身份识别/验证。它与用户 ID/密码一起用作**多因素身份验证**的形式。
它用于监控。一些软件解决方案跟踪每个用户帐户的击键行为,而无需最终用户的知情。此跟踪用于分析帐户是否被共享或由真实帐户所有者以外的任何人使用。它用于验证某些软件许可证是否被共享。
击键识别系统的优点
- 它不需要特殊的硬件来跟踪这种生物识别信息。
- 它是一种快速而安全的识别方式。
- 打字的人不必担心被监视。
- 用户无需进行注册或输入其实时样本的培训。
击键识别系统的缺点
候选人的打字节奏可能会在几天或一天内发生变化,因为疲劳、疾病、药物或酒精的影响、键盘的变化等。
没有已知的仅用于执行区分信息的特征。
语音识别
语音识别生物识别模式是生理模式和行为模式的结合。语音识别就是声音识别。它依赖于受以下因素影响的特征:
**生理成分** - 人的声带、嘴唇、牙齿、舌头和口腔的物理形状、大小和健康状况。
**行为成分** - 人说话时的情绪状态、口音、语气、音调、说话速度、含糊不清等。
语音识别系统
语音识别也称为说话人识别。在注册时,用户需要对着麦克风说一个词或短语。这对于获取候选人的语音样本是必要的。
来自麦克风的电信号通过模数转换器 (ADC) 转换为数字信号。它作为数字化样本记录到计算机内存中。然后,计算机比较并尝试将候选人的输入语音与存储的数字化语音样本进行匹配,并识别候选人。
语音识别模式
语音识别有两种变体:**说话人相关**和**说话人无关**。
说话人相关的语音识别依赖于候选人特定语音特征的知识。该系统通过语音训练(或注册)学习这些特征。
在使用该系统识别所说的内容之前,需要对其进行用户训练,使其适应特定的口音和语气。
如果只有一个用户将使用该系统,这是一个不错的选择。
说话人无关的系统能够通过限制语音的上下文(例如单词和短语)来识别来自不同用户的语音。这些系统用于自动电话接口。
它们不需要对每个用户进行系统训练。
对于不同个人使用的情况,在不需要识别每个候选人的语音特征的情况下,它们是一个不错的选择。
语音识别和语音识别之间的区别
说话人识别和语音识别被误认为是相同的;但它们是不同的技术。让我们看看,如何:
说话人识别(语音识别) | 语音识别 |
---|---|
语音识别的目的是识别**谁**在说话。 | 语音识别旨在理解和理解**说了什么**。 |
它用于通过分析其音调、语音音高和口音来识别一个人。 | 它用于免提计算、地图或菜单导航。 |
语音识别的优点
- 易于实施。
语音识别的缺点
- 容易受到麦克风质量和噪音的影响。
无法控制影响输入系统的因素会显着降低性能。
一些说话人验证系统也容易受到通过录制语音进行的欺骗攻击。
语音识别的应用
- 执行电话和互联网交易。
使用基于交互式语音响应 (IRV) 的银行和医疗保健系统。
- 将音频签名应用于数字文档。
- 在娱乐和紧急服务中。
- 在线教育系统中。
多模态生物识别系统
我们到目前为止讨论的所有生物识别系统都是单模态的,它们采用单一的信息来源进行身份验证。顾名思义,多模态生物识别系统的工作原理是接受来自两个或多个生物识别输入的信息。
多模态生物识别系统扩展了系统从用户那里获取身份验证的输入信息的范围和种类。
为什么要使用多模态生物识别?
单模态系统必须应对各种挑战,例如缺乏保密性、样本的普遍性、用户在处理系统时的舒适度和自由度、对存储数据的欺骗攻击等。
通过采用多模态生物识别系统可以解决其中一些挑战。
它需要使用的原因还有很多,例如:
多个特征的可用性使多模态系统更加可靠。
多模态生物识别系统增强了用户数据的安全性和保密性。
多模态生物识别系统采用融合策略来结合每个子系统的决策,然后得出结论。这使得多模态系统更加准确。
如果任何一个标识符由于已知或未知原因无法工作,则系统仍可以通过使用其他标识符来提供安全保障。
多模态系统可以通过应用活力检测技术来提供有关输入样本“活力”的知识。这使得它们能够检测和处理欺骗行为。
多模态生物识别系统的工作原理
多模态生物识别系统具有单模态系统的所有传统模块:
- 采集模块
- 特征提取模块
- 比较模块
- 决策模块
此外,它还具有一项融合技术,用于集成来自两个不同身份验证系统的信息。融合可以在以下任何级别进行:
- 在特征提取期间。
- 在将实时样本与存储的生物识别模板进行比较期间。
- 在决策期间。
在初始阶段集成或融合信息的多分量生物识别系统被认为比在后期集成信息的系统更有效。其显而易见的原因是,早期阶段包含比比较模块的匹配分数更准确的信息。
多模态生物识别系统中的融合场景
在多模态生物识别系统中,特征和组件的数量可能会有所不同。它们可以如下所示:
- 单个生物识别特征,多个传感器。
单个生物识别特征,多个分类器(例如,基于细节的匹配器和基于纹理的匹配器)。
单个生物识别特征,多个单元(例如,多个手指)。
个人的多个生物识别特征(例如,虹膜、指纹等)
然后对这些特征进行操作以确认用户的身份。
多模态生物识别系统的设计问题
在设计多模态生物识别系统时,您需要考虑许多因素:
- 您需要达到的安全级别。
- 将使用该系统的用户数量。
- 您需要获取的生物特征类型。
- 来自用户的生物特征数量。
- 需要集成多个生物特征的级别。
- 采用集成信息的技术。
- 开发成本与系统性能之间的权衡。
生物识别模式选择
为了能够选择合适的生物识别系统,您需要从各个方面对其进行比较。您需要根据便利性、系统规格和性能以及您的预算来评估系统是否适合您的需求。
您可以通过研究各种有效性标准来选择最合适的生物识别系统。
有效生物识别系统的标准
衡量生物识别系统有效性的七个基本标准:
唯一性 - 它决定了生物识别系统能够从用户组中唯一识别用户的程度。这是主要标准。
普遍性 - 它表示需要世界上每个人的独特特征,这些特征是无法复制的。这是次要标准。
持久性 - 它表示记录的个人特征需要在数据库中保持一段时间。
可采集性 - 指获取、测量或进一步处理个人特征的难易程度。
性能 - 系统在准确性、速度、故障处理和鲁棒性方面的效率。
可接受性 - 指用户友好性,或者用户对技术的接受程度,以便他们愿意配合捕获和评估其生物特征。
规避 - 使用人工制品或替代品模仿特征的难易程度。
各种生物识别模态的比较
让我们根据以下方面比较所有生物识别系统:
生物特征 | 普遍性 | 唯一性 | 持久性 | 可采集性 | 性能 | 可接受性 | 规避 |
---|---|---|---|---|---|---|---|
指纹 | 中等 | 高 | 高 | 中等 | 高 | 中等 | 高 |
人脸识别 | 高 | 低 | 中等 | 高 | 低 | 高 | 低 |
手部几何 | 中等 | 中等 | 中等 | 高 | 中等 | 中等 | 中等 |
虹膜识别 | 高 | 高 | 高 | 中等 | 高 | 低 | 高 |
视网膜扫描 | 高 | 高 | 中等 | 低 | 高 | 低 | 高 |
DNA | 高 | 高 | 中等 | 高 | 高 | 低 | 低 |
击键 | 高 | 低 | 低 | 高 | 中等 | 高 | 高 |
签名 | 低 | 低 | 低 | 高 | 低 | 高 | 低 |
语音 | 中等 | 低 | 低 | 中等 | 低 | 高 | 低 |
您可以根据需要处理的标准选择合适的生物识别系统,如表所示。
生物识别系统性能
生物识别系统制造商声称系统性能很高,但在实际操作环境中很难实现。可能的原因是在受控环境设置中进行的测试、硬件限制等。
例如,语音识别系统只有在安静的环境中才能高效工作,人脸识别系统在光照条件受控的情况下才能正常工作,并且可以对候选人进行培训,让他们正确清洁并放置手指在指纹扫描仪上。
然而,在实践中,目标操作环境中可能无法获得这种理想条件。
性能测量
生物识别系统的性能测量与错误拒绝率 (FRR) 和错误接受率 (FAR) 密切相关。
FRR 也称为类型 I 错误或错误不匹配率 (FNMR),它表示合法用户被系统拒绝的可能性。
FAR 称为类型 II 错误或错误匹配率 (FMR),它表示系统接受虚假身份声明的可能性。
理想的生物识别系统预计对 FAR 和 FRR 都产生零值。这意味着它应该接受所有真实用户并拒绝所有虚假身份声明,这在实践中是无法实现的。
FAR 和FRR 彼此成反比。如果提高了 FAR,则 FRR 会下降。提供高 FRR 的生物识别系统可确保高安全性。如果 FRR 太高,则系统需要多次输入实时样本,这会降低其效率。
当前生物识别技术的性能远非理想。因此,系统开发人员需要根据安全要求在这两个因素之间保持良好的平衡。
模式识别与生物识别
模式识别涉及识别模式并再次确认它。通常,模式可以是指纹图像、手写草书单词、人脸、语音信号、条形码或互联网上的网页。
单个模式通常根据其属性分为不同的类别。当具有相同属性的模式组合在一起时,生成的组也是一个模式,通常称为模式类。
模式识别是观察、区分感兴趣的模式并对模式或模式类做出正确决策的科学。因此,生物识别系统应用模式识别来识别和分类个人,方法是将其与存储的模板进行比较。
生物识别中的模式识别
模式识别技术执行以下任务:
分类 - 识别手写字符、验证码、区分人和计算机。
分割 - 检测图像中的文本区域或面部区域。
句法模式识别 - 确定一组数学符号或运算符如何相关,以及它们如何构成有意义的表达式。
下表突出显示了模式识别在生物识别中的作用:
模式识别任务 | 输入 | 输出 |
---|---|---|
字符识别(签名识别) | 光信号或笔划 | 字符名称 |
说话人识别 | 语音 | 说话人的身份 |
指纹、面部图像、手部几何图像 | 图像 | 用户身份 |
模式识别的组成部分
模式识别技术将人类特征的随机模式提取成紧凑的数字签名,该签名可以用作生物识别标识符。生物识别系统使用模式识别技术对用户进行分类并单独识别它们。
模式识别的组成部分如下:
模式识别中的常用算法
最流行的模式生成算法是:
最近邻算法
您需要获取未知个体的向量并计算其与数据库中所有模式的距离。最小的距离给出最佳匹配。
反向传播 (Backprop) 算法
它有点复杂,但非常有用的算法,涉及大量数学计算。
信号处理与生物识别
在现实世界中,我们可以获得各种信号,例如声音、光、无线电信号、人体生物医学信号等。所有这些信号都以连续的信息流形式存在,称为模拟信号。人声是我们从现实世界中获得并用作生物识别输入的一种信号。
什么是信号?
信号是包含某些信息的、可测量的物理量,可以传输、显示、记录或修改。
生物识别中的信号处理
处理信号的原因有很多。生物识别系统出于各种原因需要语音处理:
- 从候选人的样本中提取有意义的信息。
- 去除样本中的噪声。
- 使样本可传输。
- 去除样本失真。
模拟信号处理模块将现实世界的信息(例如声波)转换为 0 和 1 的形式,使其可以被现代数字系统(例如生物识别系统)理解和使用。击键、手部几何、签名和语音属于信号处理和模式识别的领域。
数字信号处理系统 (DSP)
有两种类型的信号:模拟信号和数字信号。模拟信号是不间断的、连续的信息流,而数字信号是 0 和 1 的流。
DSP 系统是生物识别系统的重要组成部分之一,它通过使用模数转换器 (ADC) 进行采样和数字化,将模拟信号转换为离散数字值的流。
DSP 是单芯片数字微型计算机,它处理由来自摄像机、指纹传感器、麦克风等的电子传感器生成的电信号。
生物识别中的 DSP
DSP 使生物识别系统能够变得小巧且易于携带,能够高效运行并总体上降低成本。
DSP 架构旨在支持涉及大量乘法和加法的复杂数学算法。DSP 可以借助其算术逻辑单元 (ALU) 内部的乘法/累加 (MAC) 硬件在一个周期内执行乘法/加法。
它还可以使用二维快速傅里叶变换 (FFT) 和有限 IR 滤波器增强捕获图像的分辨率。
生物识别与图像处理
在信息时代,图像占据了很大一部分。在生物识别中,图像处理是识别个人的必要条件,其生物识别图像以前存储在数据库中。面部、指纹、虹膜等是基于图像的生物识别技术,需要图像处理和模式识别技术。
为了使基于图像的生物识别系统能够准确地工作,它需要以非常清晰且未经篡改的形式拥有用户生物识别信息的样本图像。
生物识别中图像处理的需求
用户生物识别的图像被输入到生物识别系统中。该系统被编程为使用方程式操纵图像,然后存储每个像素的计算结果。
为了选择性地增强数据中的某些精细特征并去除某些噪声,数字数据会进行各种图像处理操作。
图像处理方法可以分为三个功能类别:
图像恢复
图像恢复主要包括:
- 减少在获取样本时引入图像中的噪声。
- 删除在生物识别注册期间出现的失真。
图像平滑减少图像中的噪声。平滑通过用每个像素与其相邻像素的平均值替换来实现。生物识别系统使用各种滤波算法和降噪技术,例如中值滤波、自适应滤波、统计直方图、小波变换等。
图像增强
图像增强技术可以改善图像任何部分或特征的可见性,并抑制其他部分的信息。它仅在恢复完成后进行。它包括亮度增强、锐化、对比度调整等,以便图像可用于进一步处理。
特征提取
从图像中提取两种类型的特征,即 -
一般特征 - 用于描述图像内容的形状、纹理、颜色等特征。
特定领域特征 - 它们是与应用程序相关的特征,例如人脸、虹膜、指纹等。Gabor滤波器用于提取特征。
当从图像中提取特征时,您需要选择合适的分类器。广泛使用的分类器最近邻分类器,它将候选图像的特征向量与存储在数据库中的图像向量进行比较。
B样条曲线是应用于描述指纹生物识别系统中曲线模式的近似方法。B样条曲线的系数用作特征。在虹膜识别系统中,虹膜图像使用离散小波变换 (DWT) 进行分解,然后使用 DWT 系数作为特征。
生物识别系统安全
生物识别系统的操作在很大程度上取决于容易受到操作限制的输入设备。有时,设备本身可能无法捕获必要的输入样本。它们可能无法充分捕获样本。这使得系统不可靠且容易受到攻击。
生物识别系统越容易受到攻击,其安全性就越低。
生物识别系统漏洞
生物识别系统漏洞的主要原因有两个 -
系统故障
生物识别系统无法工作的两种方式 -
内在故障 - 它们是诸如传感器无法工作、特征提取、匹配或决策模块故障等故障。
由于攻击导致的故障 - 它们是由于生物识别系统设计中的漏洞、攻击者可以利用的任何计算、来自不道德的系统管理员的内部攻击等造成的。
不安全的基础设施
如果生物识别系统的硬件、软件和用户数据没有得到保护,则恶意用户可以访问该系统。
生物识别系统安全风险
生物识别系统安全性很重要,因为生物识别数据不容易撤销或替换。关于生物识别系统安全,存在以下突出风险 -
用户数据被盗的风险
如果生物识别系统存在漏洞,黑客可以破坏其安全并收集数据库中记录的用户数据。这会给隐私带来更大的危害。
用户数据被泄露的风险
获取生物识别样本后,黑客可以向系统提供伪造的样本。如果用户数据被泄露,它将永远被泄露。显而易见的原因是,用户只有有限数量的生物特征,并且它们难以替换,不像密码或身份证。
尽管生物识别数据已加密并存储,但需要对其进行解密才能进行匹配。在匹配时,黑客可能会破坏安全性。
生物识别系统安全
为了解决生物识别系统安全问题,已经提出了许多解决方案。生物识别模板绝不以原始形式存储。它们是加密的;有时甚至两次加密。
在生物识别的情况下,涉及各种资源,例如人类(主体或候选人)、实体(系统组件或流程)和生物识别数据(信息)。机密性、完整性、真实性、不可否认性和可用性的安全要求在生物识别中至关重要。让我们简要了解一下它们 -
真实性
它是纯正、真实或原始的质量或状态,而不是被复制。当信息在创建、存储或传输时处于相同的状态和质量时,它就是真实的。
生物识别系统中存在两种真实性 - 实体真实性和数据来源真实性。实体真实性确认参与整个处理的所有实体都是它们声称的实体。数据来源真实性确保数据的真实性和原始性。例如,生物识别数据是由传感器设备捕获的。来自真实传感器的捕获数据不是来自先前记录的欺骗。
机密性
它限制授权用户的信息访问和披露,并防止未经授权的人员访问或披露。在生物识别系统的情况下,它主要指生物识别和相关的身份验证信息在捕获和存储时需要对未经授权的实体保密。
生物识别信息只能完全由其所属的人员访问。在识别和变化期间,需要使用适当的安全措施来限制访问候选人。
完整性
它是完整且未更改的状态,指的是其一致性、准确性和正确性。对于生物识别系统,完整性应该很高。通过包含其通知和更正,应避免或尽早检测到操作和存储期间的任何恶意操作。
不可否认性
它识别所涉及的资源,例如实体和组件。它也被视为问责制。例如,它禁止生物识别信息的发送者或接收者否认发送或接收生物识别信息。
可用性
如果集合的所有成员都可以访问资源,则资源相对于一组实体具有可用性属性。一个称为可达性的方面确保人类或系统进程可以或不可以联系,具体取决于用户兴趣。
攻击者可以使系统对合法用户不可用,从而阻止他们使用经过身份验证的应用程序。这些攻击者以信息的可用性为目标。
生成生物识别模板的标准
以下是生成生物识别模板的标准 -
确保模板来自人类候选人,并由真实的传感器和软件捕获。
通过具有不可逆性的加密来保护生物识别模板。这使得黑客难以从安全模板中计算原始生物识别信息。
创建不可链接(唯一)的生物识别模板。生物识别系统不应该能够访问记录到另一个生物识别系统中的相同候选人的模板。如果黑客设法从一个生物识别系统中检索到一个生物识别模板,他应该无法使用此模板通过另一个生物识别系统获得访问权限,即使这两个验证都可能基于候选人的相同生物识别模板。此外,不可链接的生物识别系统应该使根据两个模板之间的关系推导出任何信息成为不可能。
创建可取消和可更新的模板。它强调能够取消或停用受损的模板并重新生成另一个模板的能力,类似于可以重新生成丢失或被盗的智能卡的方式。
通过加盐技术实现“可更新”和“不可链接”特性。加盐将随机生成的唯一数据(称为“盐”)添加到原始信息中,使其与其他信息区分开来。
设计一个关于 FAR 和 FRR 的生物识别系统精度。
仔细选择合适的加密算法。某些算法可能会放大个体生物识别数据固有的微小差异,这可能导致更高的 FRR。
使用重要的加密技术,例如哈希方法,在每次模板生成时应用不同的排列时,该方法非常有效。即使使用相同的输入生物识别数据,不同的排列也能确保每个模板的唯一性。
采用有效的保护方案来提高系统的性能。
在生物识别数据的安全和隐私方面,正在进行大量的研究和开发。