人工智能 - 智能体与环境
一个 AI 系统由一个智能体及其环境组成。智能体在其环境中行动。环境可能包含其他智能体。
什么是智能体和环境?
智能体是指任何能够通过传感器感知其环境并通过效应器作用于该环境的事物。
人类智能体拥有与传感器平行的感官器官,如眼睛、耳朵、鼻子、舌头和皮肤,以及其他器官,如手、脚、嘴,作为效应器。
机器人智能体用摄像头和红外测距仪代替传感器,用各种电机和执行器代替效应器。
软件智能体将其程序和动作编码为比特串。
智能体术语
智能体的性能度量 - 它是决定智能体成功程度的标准。
智能体的行为 - 智能体在任何给定的感知序列之后执行的动作。
感知 - 智能体在给定时刻的感知输入。
感知序列 - 智能体迄今为止感知到的所有内容的历史记录。
智能体函数 - 它是一个从感知序列到动作的映射。
理性
理性无非是合理、明智和具有良好判断力的状态。
理性关注的是预期行动和结果,具体取决于智能体感知到的内容。以获取有用信息为目标执行操作是理性中的重要部分。
什么是理想理性智能体?
理想理性智能体是指能够执行预期操作以最大化其性能度量的智能体,其依据是 -
- 其感知序列
- 其内置的知识库
智能体的理性取决于以下因素 -
性能度量,决定成功的程度。
智能体迄今为止的感知序列。
智能体关于环境的先验知识。
智能体可以执行的动作。
理性智能体始终执行正确的动作,其中正确动作是指导致智能体在给定感知序列中获得最大成功的动作。智能体解决的问题的特征在于性能度量、环境、执行器和传感器 (PEAS)。
智能体的结构
智能体的结构可以视为 -
- 智能体 = 架构 + 智能体程序
- 架构 = 智能体执行的机器。
- 智能体程序 = 智能体函数的实现。
简单反射智能体
- 它们仅根据当前感知选择动作。
- 只有当仅根据当前感知做出正确决策时,它们才是理性的。
- 它们的环境是完全可观察的。
条件-动作规则 - 它是一个将状态(条件)映射到动作的规则。
基于模型的反射智能体
它们使用世界的模型来选择其动作。它们维护一个内部状态。
模型 - 关于“世界上事物如何发生”的知识。
内部状态 - 它是一个关于当前状态的未观察到的方面的表示,取决于感知历史。
更新状态需要以下信息 -
- 世界如何演变。
- 智能体的动作如何影响世界。
基于目标的智能体
它们选择其动作以实现目标。基于目标的方法比反射智能体更灵活,因为支持决策的知识被显式建模,从而允许进行修改。
目标 - 它是对理想情况的描述。
基于效用的智能体
它们根据对每个状态的偏好(效用)选择动作。
当以下情况发生时,目标是不够的 -
存在相互冲突的目标,其中只能实现少数目标。
目标实现存在一定的不确定性,您需要权衡成功的可能性与目标的重要性。
环境的性质
一些程序在完全人工环境中运行,该环境仅限于键盘输入、数据库、计算机文件系统和屏幕上的字符输出。
相比之下,一些软件智能体(软件机器人或软机器人)存在于丰富、无限的软机器人领域。模拟器具有非常详细、复杂的环境。软件智能体需要实时地从一系列动作中进行选择。一个旨在扫描客户在线偏好并向客户展示有趣商品的软机器人工作在真实和人工环境中。
最著名的人工环境是图灵测试环境,其中一个真实智能体和另一个人工智能体在同等条件下进行测试。这是一个非常具有挑战性的环境,因为软件智能体很难像人类一样表现。
图灵测试
可以使用图灵测试来衡量系统智能行为的成功程度。
两个参与者和一个待评估的机器参与测试。在两个人中,一个人扮演测试者的角色。他们各自坐在不同的房间里。测试者不知道谁是机器谁是人类。他通过键入和发送问题来询问这两个智能体,并收到键入的回复。
此测试旨在愚弄测试者。如果测试者无法从人类的反应中区分出机器的反应,则称该机器具有智能。
环境的特性
环境具有多种特性 -
离散/连续 - 如果环境存在有限数量的不同的、明确定义的状态,则该环境是离散的(例如,国际象棋);否则它是连续的(例如,驾驶)。
可观察/部分可观察 - 如果可以从感知中确定环境在每个时间点的完整状态,则它是可观察的;否则它仅部分可观察。
静态/动态 - 如果环境在智能体行动时不发生变化,则它是静态的;否则它是动态的。
单智能体/多智能体 - 环境可能包含其他智能体,这些智能体可能与智能体相同或不同。
可访问/不可访问 - 如果智能体的感官设备可以访问环境的完整状态,则该环境对于该智能体是可访问的。
确定性/非确定性 - 如果环境的下一个状态完全由当前状态和智能体的动作决定,则该环境是确定性的;否则它是非确定性的。
情景/非情景 - 在情景环境中,每个情景都包括智能体感知然后采取行动。其行动的质量仅取决于情景本身。后续情景不依赖于先前情景中的行动。情景环境要简单得多,因为智能体不需要提前思考。