作为中国自动化领域的权威旗舰网络媒体,控制网创立于1999年7月,是中国举行的第十四届IFAC (International Federation of Automatic Control)大会的中国官方组织机构的唯一指定网站。控制网是中国自动化学会专家咨询工作 委员会(ECC)的秘书处常设之地。是北京自控在线文化传播有限公司开设的网站。
标题 | MAS体系结构在遥操作系统中的应用研究 |
技术领域 | |
行业 | |
简介 | 本文设计了一个基于多智能体系统(Multi-Agent System;MAS)结构的遥操作系统框架模型,它结合离散事件状态(Discrete Event State;DES)控制模型,可用于在目前广泛采用的将虚拟现实与自主智能系统相结合来克服时延影响的遥操作系统中,解决现场环境的几何学、动力学模型参数未知或不准确引起的相关问题。并以在遥操作系统中的直升飞机作为执行端为例,说明该系统框架模型的具体应用和可用性。 |
内容 |
0 引言
时延是遥操作系统中主要问题之一,时延对系统最大的影响是使连续遥操作闭环反馈控制系统变得不稳定[1]。为了有效减小时延对遥操作系统的扰动影响,基于虚拟现实技术的遥操作[2-4]成为主要研究方向之一。然而虚拟现实技术需要准确获得现场环境的几何学、动力学等模型的各种参数,这极大削弱了虚拟现实技术的应用效果。近年来将临场感方式、虚拟现实方式与自主式智能系统相结合成为克服时延影响的一种新方法[5]。自主式智能系统体系结构的主要任务是如何把感知、规划、决策、行动等各种模块有机的结合起来,从而形成具有一定特色的智能系统。当前主要体系结构形式有:Saridis[6]基于三级模型构造的分层递阶式结构;MIT的Rodney Brooks[7]基于水平分片模式的包容式体系结构;分布式人工智能(DAI)中的多智能体系统(MAS)体系结构[8 ]。目前,多智能体系统(MAS)体系结构的应用最为广泛,国外已将MAS技术应用于多智能体机器人的合作、柔性制造系统、协调专家系统、并行工程、交通控制、企业及社会经济系统、Internet网络等[9-14]。在国内,上海交通大学以及浙江大学等也进行了多智能体系统智能机器人的研制。 MAS的结构类似于网络的形式,其中基本节点为智能体(Agent),它们具有独立的知识、工作模型和专门的输入输出结构,从网上获得所需要的输入数据,通过加工之后送回网络。网络提供了智能体之间信息交流的通道,凡是相互有关的节点均有相应的通道。与一般的网络结构不同的是,MAS还有一个被称为协调机构的环节实现网络的管理和运行,它负责任务的划分、智能节点的组织安排和工作时的动态协调;此外还提供共享信息和节点间交流的工具;其中协调机构是MAS的核心。基于多智能体系统(MAS)体系结构,本文提出一种自主遥操作系统框架,并以实例说明其有效性。
1 遥操作系统构成与工作原理 遥操作系统常采用主从控制,主要由操作者、控制端、通信环节、执行端和环境构成(如图1所示)。 ![]() 由于通讯时延的影响,操作者不能实时地感受到执行端与环境的交互信息,因此在操作者处,通常应用虚拟现实技术,建立虚拟的执行端和环境,由虚拟的执行端和环境提供给操作者以实时的虚拟力反馈。但是在环境参数未知或不准确的时候虚拟现实技术不能很好的发挥作用,这时结合自主智能系统能取得不错的效果;执行端在远地控制器的自主控制下仍可按既定策略完成某些特定的作业任务或具有某些自主功能。以下将详细介绍基于MAS体系结构的自主操作。 2 基于Multi-Agent System(MAS)的遥操作 基于MAS的遥操作系统,把各个功能模块作为有一定独立工作能力的智能体,使之能按需要与任何其他智能体进行点对点的通信。每个智能体具有图2所示的结构,其核心是工作模式库,可以存放多种功能程序。状态信号可以起到内部功能的切换作用,同时也起到引导系统各功能模块之间的信息流向,从而改变系统组织结构的作用。由于状态是变化的,因而结构是动态可变的。
![]() 图2 功能模块智能体的构造
各个智能体相互通讯、彼此协调,共同完成复杂的任务。系统不仅具备一般分布式系统所具有的资源共享、易于扩张的特点,而且克服了建立一个庞大知识库所造成的知识管理的困难,具有很强的灵活性和可靠性,适合于实时要求较高的作业任务[10]。我们设计了一个基于MAS的遥操作系统模型(图3)。图3显示的是一个利用黑板系统作为协调机构的自主式系统的结构框图。黑板系统记录当前各智能体的工作状态、全局性的数据和产生的假说,各智能体的交互通过黑板系统进行。 ![]() 图3 基于MAS的遥操作系统模型
在执行端活动过程中,所需感知的信息量非常大,而且必须能够迅速处理许多动态信息。先进的传感仪器,例如CCD、雷达测距仪、红外探测仪等,具有精确度高、环境适应性强、感知范围广等优点,并且还可以监测执行端本身的信息。传感技术的应用大大拓宽和延伸了执行端对环境的感知能力。在设计环境感知系统时,还要充分考虑控制端的作用,尽量把适合于人感知的任务交给控制端去完成,把适合于机器去感知的任务交给执行端自己去做,从而实现控制端与执行端的合理分工和密切协作。 系统主动利用机器环境感知得到的信息建立环境模型,对执行端的运行状态进行评价预测,并根据危险程度做出行为决策。评价决策任务由多智能体和黑板系统联合完成,如图3所示。环境感知的变化可以看作为事件,黑板系统根据事件的发生协调各智能体的工作方式、决定总体对策,使系统转入不同的状态。
由于环境事件是随机的离散事件,这种“事件―状态”模型称之为离散事件状态(DES)控制模型。为了引出DES的定义,我们先给出几个基本概念。
定义1 消息数据。 一个消息是指一个功能模块的一个输入或输出,所有同种类型的消息组成一个消息数据。消息数据往往与某一个功能模块有关(例如输出结果),因而它有固定的数据格式。 对于遥操作系统来说,所有的消息均可分为m0,m1,m2三大类。其中,m0为总体输入消息集,是指那些输入环境感知功能模块的输入消息类,例如传感器的输入,它们构成了整个系统的输入集合;m1为总体输出消息集,是指产生一定行为的消息类,由控制外部设备的功能模块输出,它们构成了整个系统的输出集合;m2为内部消息集,是指功能模块之间的互为输入输出的数据集合。
定义2 事件是功能模块对每次工作结果的定性描述。 它可以是处理结果的简洁的结论;也可以指功能模块本身工作状态的描述。事件可简单的由字符串或编码表示。 定义3 状态是对当前整个系统的内外现状的一种表述。 它是对系统内部和外部环境形势评估的结论,可用来作为指导各功能模块工作的依据。与事件一样,它可用符号串或编码来表示。 据此,我们可以给出DES的定义如下。
定义4 DES是一种描述自主式智能系统工作机构的自动机。
它规定了系统的信息处理构造形势和工作方式,由七倍体组成:DES=(M,E,S,F,C,so,se) ![]() 协调机构C是一个特殊的工作模块。它根据由各个功能模块上报的事件集合 和当前的状态 ,变换出新的状态 。这里, 是当前各子系统工作情况的总结,描述了系统外部环境和内部各部分的总体形势,因此可以说状态的变换是基于对系统的总体形势的评估和判断。这样,由于 决定了个功能模块的功能选择,而它的设置又取决于全局的形势,因此DES是事件驱动―行为决策方式的自主式智能控制系统。 3 MAS结构在无人直升机自主着陆中的应用分析 这里以无人直升机作为执行端说明其在遥操作系统中的具体实现。
功能模块F:按机构和功能分为三大类:(1)传感模块:包括路径识别、图像理解、超声测障、定位估计等模块;(2)决策模块:包括信息融合、全局规划、局部路径规划、环境建模、状态评估等模块;(3)执行模块: 包括自主避障、紧急响应、跟踪着陆等模块。 协调机构C:采用黑板式控制,有记录黑板、知识库及推理引擎三个部分组成。其中记录黑板收集各个功能模块送来的事件报告,知识库存放事件―状态转换模型,以及协调功能模块工作时序和直升机空间关系的导航模型。 M集合:由三维图像、距离图像、超声信号、目标特征、障碍区域、局部地形、局部路径、全局路径、行动命令等多个结构化数据构成。 E集合:由直道、发现障碍、发现疑似目标、超过目标、弯道等多种符号组成。 S集合:由平飞状态、后飞状态、侧飞状态、垂直升降状态、悬停状态、初始化状态、终点状态、遥操作状态等组成。 其主要状态转换及事件关系如图4所示。
![]() 图4 遥操作系统状态转换图 下面以垂直升降为例说明遥操作系统中的相关状态转化过程:从初始状态 出发,各功能模块进入初始化工作状态,然后进入自主状态,各个智能体一方面对输入的消息进行加工,另一方面对处理进行评价,形成事件 直接上报给黑板。黑板的调度推理机根据事件、全局情况、事件状态转换规则决定新的状态 ,若 就是垂直升降状态时,紧急响应模块执行垂直升降避障,否则通过消息通知各智能代理在新的状态 下工作。 4 结论 本文对遥操作系统的时延问题进行了分析,并建立了一个基于多智能体系统(MAS)的遥操作系统模型。在动态实时的环境下,由于存在着严格的时间约束,将临场感方式、虚拟现实方式与自主智能系统相结合是一种克服时延影响的更为有效的方法;采用自主式智能系统辅助监视和控制处理,通过一定形式的人机交互作用,把人和机器的智能结合起来,是遥操作系统的重要发展方向之一。
[1] 李成,梁斌. 空间机器人的遥操作. 宇航学报,2001,22 (1):95-98
[2] 庄骏,邱平,孙增圻. 大时延环境下的分布式遥操作系统. 清华大学学报(自然科学版),2000,40(1):80-83
[3] 陈卫东,席裕庚,蔡鹤皋. 虚拟现实系统中的手部跟踪和力觉再现技术研究. 测控技术, 1999,18(6):18-21
[4] 曾庆军, 陈善隆, 黄惟一. 力觉临场感遥控作业虚拟现实系统研究. 东南大学学报, 1999,29(2):1-5
[5] 李华忠, 杨维萍, 柳长安. 基于虚拟现实的空间机器人共享控制系统及其仿真. 宇航学报, 2000,21(3):100-105
[6] Saridis G N.Toward the Realization of Intelligent of Controls.Proc.of the IEEE,1979,67(8):1115-1133
[7] Brook R.A Robust Layered Control System for Mobile Robot.IEEE J Robotics and Automation,1986,2(1):14-23
[8] Dunin-Keplicz B etc.Compositional Formal Specification of Multi-Agent Systems.Lecture Notes in AI, 1994
[9] V R Lesser,D D Corkill.The distributed vehicle monitoring tested. Artificial Intelligence,1983,4:63-109
[10] L Gasser,C Braganza,N Herman.MACE:A flexible tested for distributed AI research in distributed artificial intelligence,1989,119-153
[11] G Vernazza,R Zunino.A distributed intelligent methodology for railway traffic control.IEEE Trans on Vehicular Technology,1990,39(3):263-270
[12] G Q Huang.An agent-based framework for cooperating expert system s in concurrent engineering.Engineering Application of Artificial Intelligence,1994,7(6):685-693
[13] N R Jennings,L Z Varga, R P Aarnts. Transforming standalone expert systems into a community of cooperating agents.Artificial Intelligence,1993,6(4):317-331
[14] P Faruk,S Shakhar.Distributed conflict resolution among cooperating expert systems.Expert Systems,1993,10(4):227-236
[15] 刘金琨,王树青. 复杂实时动态环境下的多智能体系统. 控制与决策,1998(7):385-407
|