对话界面 – 语音识别技术


对话是生活中的一部分。但是计算机也能进行对话吗?嗯,在过去的几十年里,计算机和人类已经开始通过语音识别和语音合成技术相互交互。被称为“对话界面 (CI)”,我们将探讨这些界面是如何演变的,以及各种类型和当前流行的最新界面。

背景

人类和计算机最初通过“终端界面”相互交互。他们使用命令行或 DOS 提示符。但是由于缺乏语法知识,它并没有发展成为主流语言。接下来是“图形用户界面”,其中包括视觉图像、文件、操作,使交互更加容易。但它也没有持续太久,因为这些代表了抽象。现在出现的则是“对话界面”。顾名思义,人类使用自然语言与机器交互,使它们更具感知力、熟练度和可访问性。

对话界面 (CI)

CI 只是模仿与人类对话的用户界面。存在两种类型的界面——语音助手和聊天机器人。语音助手的示例包括苹果的 Siri、Windows Cortana、微软 Office Tay、Google Now 和亚马逊 Echo (Alexa),它们风靡全球。亚马逊的 Echo 可以调暗灯光、播放音乐、订购披萨等等。人们只需说话就可以进行搜索或收听歌曲。由于它们可以尽可能自然地与人类对话,因此显得更加个性化。聊天机器人,如 Facebook 的 M、Slack 的 Slackbot、Slack 的 Howdy 等,可用于预订、下订单等。

在这些界面上,随时可用、信息整理和共享变得容易。其他活动,如在线购物、叫车等也变得更容易,例如虚拟旅行代理 Pana、在线购物应用程序 Operator 等。CI 尤其有利,因为它们可以在笔记本电脑、智能手机、智能手表等设备上运行。此外,它们可以与其他平台集成,如 Snapchat、Twitter、Facebook 等。语音识别技术的另一个例子是中国流行的搜索引擎百度 (DuEr)、微信或最新的 Deep Speech 2。百度处理诸如天气、污染水平等查询。

此外,聊天机器人有两种不同的类型——基于人工智能的聊天机器人和基于规则的聊天机器人;或者它们可以是基于文本的或语音控制的。第三种伪聊天机器人可以归类为微软的 Clippy 和 Quartz 的短信应用程序。在这里,视觉效果与聊天机器人的相同,但无法像聊天机器人那样进行对话。像 Adrian Zumbrunnen 和 uxdesign.cc 这样的网站也可以被视为 CI。

CI 也在业务中发挥着作用。例如,房地产。用户可以点击网站搜索房屋,并与聊天机器人互动,获取所需的所有信息,同时获得相关答案。CI 更多地使用文本(单词)、内容,并使对话与用户顺畅进行。需要牢记的一个重要方面是,使用 CI 时,信息流应该清晰。用户必须理解对话并确认他们的理解。必须保持连续性,尽可能自然,并专注于个性化。动画对于聊天机器人来说也很重要,可以提高满意度。

爆炸式增长

CI 已经存在多年,但现在正在数字领域赶超。它们与 GUI 彻底不同,因为它们使用文本,提供更好的体验。CI 中的交互模式本质上是对话——书面(Facebook M)、语音(亚马逊 Alexa)或混合(Siri/Cortana,因为响应可以是语音或文本)。最后,CI 倾向于提供选择来选择回复。冒险游戏是 CI 的一种形式,但由于它们难以学习,GUI 取而代之,最终让位于称为 CI 的文本交互。现在,由于移动连接、物联网设备、社交网络平台、消息传递世界和基于云的人工智能驱动的应用程序,所有这些都为 CI 的兴起提供了理由。但当然,企业需要了解其愿景和战略、社交媒体中的存在、底层流程和指标以及在加入潮流创建 CI 之前所需的支撑。

现在,全球 CI 的爆炸式增长是由于竞争和创新。企业需要领先于竞争对手。通过 CI(如聊天机器人),可以实现即时帮助和信息收集。此外,CI 了解所说的话,并准确地猜测消费者的需求。但有时,人们不会以直接的方式说话,这会导致询问的问题和得到的答案之间存在差异。但是,Normalizer 就是这样一个应用程序,它在一定程度上解决了缩写、俚语等问题。

CI 必须理解自然语言并做出同样自然的回应。其他非常流行的聊天机器人包括美国诺德斯特龙 (购物)、通过 Facebook Messenger 分享航班信息的 KLM、拥有特定快捷方式或特定操作按钮的应用程序 Telegram,或允许通过 Slack 订购玉米饼的 Taco Bell。谷歌正在通过 CI 更进一步;从个人层面上看待互动。正如 Sundar Pichai 所说,“我们正在发展搜索,使其更具辅助性 [并且] 希望用户能够与谷歌进行双向持续对话,以帮助他们在现实世界中完成任务。我们认为这是为每个用户构建他们自己的个性化谷歌。”(麻省理工学院技术评论)。

优势

CI 提供了诸如即时性(响应迅速且量身定制)、普遍性(CI 通过对话或打字随时可用)、真实性(品牌提供尽可能个性化的答案)和轰动效应(品牌可以在接触更大群体时创造故事)等优势。所有这些都有助于提高企业的忠诚度和客户满意度。

人们正在认识到,CI 将极大地帮助世界各地的视障人士,因此必须将其视为一种非常智能的交流媒介。

自然语言界面正在不断发展,品牌/企业在使用 CI 的同时,可以保持领先地位。随着时间的推移,CI 将学习/了解用户的喜好、习惯和日程安排。它们最终将成为我们自身的一部分。

更新于: 2020年1月24日

157 次查看

开启您的 职业生涯

通过完成课程获得认证

开始学习
广告