语音识别



语音识别生物识别模式是生理模式和行为模式的结合。语音识别只不过是声音识别。它依赖于受以下因素影响的特征:

  • 生理成分 - 人的声带、嘴唇、牙齿、舌头和口腔的物理形状、大小和健康状况。

  • 行为成分 - 人说话时的情绪状态、口音、语调、音调、说话速度、含糊不清等。

语音识别系统

语音识别也称为说话人识别。在注册时,用户需要对着麦克风说一个单词或短语。这对于获取候选人的语音样本是必要的。

来自麦克风的电信号通过模数转换器 (ADC) 转换为数字信号。它以数字化样本的形式记录到计算机内存中。然后,计算机比较并尝试将候选人的输入语音与存储的数字化语音样本进行匹配,并识别候选人。

Voice Recognition

语音识别模式

语音识别有两种变体:说话人依赖说话人独立

说话人依赖语音识别依赖于候选人特定语音特征的知识。该系统通过语音训练(或注册)学习这些特征。

  • 在使用该系统识别所说内容之前,需要针对用户对其进行训练,使其适应特定的口音和语调。

  • 如果只有一个用户将使用该系统,这是一个不错的选择。

说话人独立系统能够通过限制语音的上下文(例如单词和短语)来识别不同用户的语音。这些系统用于自动电话接口。

  • 它们不需要针对每个单独的用户对系统进行训练。

  • 它们是不同个人使用的不错选择,在这种情况下不需要识别每个候选人的语音特征。

语音识别和语音识别之间的区别

说话人识别和语音识别被错误地认为是相同的;但它们是不同的技术。让我们看看,如何 -

说话人识别(语音识别) 语音识别
语音识别的目标是识别“谁”在说话。 语音识别旨在理解和理解“说了什么”。
它用于通过分析其音调、语音音调和口音来识别一个人。 它用于免提计算、地图或菜单导航。

语音识别的优点

  • 易于实施。

语音识别的缺点

  • 它容易受到麦克风质量和噪音的影响。
  • 无法控制影响输入系统的因素会显着降低性能。

  • 某些说话人验证系统也容易受到通过录制语音进行的欺骗攻击。

语音识别的应用

  • 执行电话和互联网交易。
  • 使用基于交互式语音响应 (IRV) 的银行和医疗保健系统。

  • 将音频签名应用于数字文档。
  • 在娱乐和紧急服务中。
  • 在在线教育系统中。
广告