1、规划与调度集成技术在航天器自主控制中的应用2007 年 6 月第 5 卷第 2 期深空探测研究DEEPS 队 CEEXPLORATLONJun.2007VO1.5NO.2规划与调度集成技术在航天器自主控制中的应用李玉庆王日新徐敏强哈尔滨工业大学科学园 3030 信箱 150080摘要:航天器自主运行将是未来航天器发展的趋势之一 .本文在前人工作的基础上,应用交互式集成技术,针对航天器问题,提出并构建了航天器自主规划与调度系统,并通过算例,介绍了它的工作过程.该系统将规划技术和调度进行了有机结合,在规划的同时进行调度,可尽早发现不合理规划并抛弃.能够充分利用已有的规划技术和调度技术,易于扩充和移
2、植,能够有效地解决航天器的自主控制问题.关键词:规划与调度;自主航天器;自主控制1 引言近年来,随着人类太空探索范围的不断扩大,对航天器自主运行的要求愈来愈高,航天器自主控制技术逐渐成为领域的研究热点.而实现航天器自主运行的一个重要问题就是如何对航天器领域中众多的活动以及活动间复杂的约束进行有效的规划和调度,从而产生合理,最优的指令序列.在传统的 AI 研究中,规划技术和调度技术的研究是分离的.规划技术的研究对象通常是有大量的可选活动,并且活动间有复杂的相互作用,研究的重点是如何选择合适的活动或者活动序列以达到目标.而调度技术的研究对象通常是活动的选择已经确定,但在时间或是资源分配上有较严格的
3、约束,研究如何合理地分配资源或时间,满足给定的约束条件(如时间约束,资源约束等),或者使目标函数最优.在航天器自主控制的研究中,人们亦采取了这种策略.例如法国 SPOT 系列卫星,开发了基于地面的智能调度系统,用于确定并优化日常拍照任务,着力解决卫星的日常调度问题;NASA 的 DS 一1 以及其后续的 ASPEN 和 CASPER 等系统主要用于指令序列的自主生成,偏重于规划问题的解决.由此不难发现,航天器领域的特点是既包含规划问题,也包含调度问题.为了实现更高层次的航天器自主控制,有必要对规划技术和调度技术进行整合,以适应航天器领域的应用要求.目前Garrido 等人在理论方面对规划和调度
4、的集成方法进行了研究,本文针对航天器领域的特点,将 f 电 f 门的研究成果做了部分改进,使之适用于航天器自主控制这一领域.2 航天器领域的特点在航天器的飞行过程中,其飞行任务多种多样,既有对地通信,又有科学探测;既有导航控制要求,又有姿态控制要求.理论上讲,每一时刻都有大量的可选活动.对每一个活动来说,都有其相应的优先级,以及执行该活动所需要的时间和资源.同时,为了完成某一活动,通常需要先完成其他活动;而目标活动完成后,又会对后续活动产生一系列的影响.例如,拍照前首先要指向该目标,拍照结束后将占用一定的存储空间,等等.与此同时,航天器领域的规划系统必须能够灵活地表示时间.例如,根据目标以及自
5、身的位置和姿态的不同,调整有效载荷指向目标所需的时间是不同的.除此之外,在资源的使用上,有些资源是可以同时被多个有效载荷使用的,有些却是具有排他性的;有些资源是可再生的,而有些资源是非再生的.所有这些,实质上是包含了活动选择,时间表示,资源分配,约束满足,以及动作排序及优化的系统问题,它将航天器的规划与调度问题变得十分复杂.单纯的使用规划技术,仅是约束的表示,就少有规划器能够胜任,而且还要进行时间和资源的推理以及分配,更是异常困难.反之,如果仅仅使2007 年 6 月深空探测研究用调度技术,虽然能够较好地处理时间和资源约束,却又难以进行大量复杂的活动选择.显然,为了适应航天器领域的应用要求,必
6、须将规划过程和调度过程结合到一个系统中进行.3 规划和调度的集成方法从时间顺序上来看,人们在研究规划和调度整合系统时,最先采用的两种方法是“直接集成方法“ 和“混合集成方法 “.目前,为了更有效地解决实际问题,越来越多的研究集中在“交互集成方法“ 上.下面对该方法做一简单介绍.这种方法采用了一种交互的形式来进行规划和调度,在规划进行的过程中交错地进行调度,既可以紧密联系规划过程和调度过程,又可以避免其他集成方法的弊端.交互集成系统的一般结构如图 1 所示.在该系统中,规划器负责选择活动以产生规划,调度器则负责在规划产生后进行约束检验,资源分配.为了提升系统的搜索性能,人们制定了很多启发式信息,
7、用于选择合适的动作以及恰当地分配资源等等.控制模块负责协调规划器和调度器的工作状态,起到一个管理中心的作用.模义图 l|交互集成系统结构在定义完毕待解决问题的模型后,就可以开始进行规划和调度了.规划和调度过程中,控制模块控制着规划器和调度器之间的交互.它首先要求规划器分析当前可进行的所有活动,产生一个活动集,相应地形成多个不完全的部分规划,然后再交给控制模块进一步处理.控制模块接到这些部分规划后,选择其中一个交给调度器进行约束验证(例如设备是否可用,资源是否足够等等),如果满足约束条件,则进行必要的资源分配.否则会要求控制模块提供新的规划,再重复这一过程.当找到正确的规划并分配资源后,控制模块
8、再将调度器处理过的规划交由规划器,在此基础上继续搜索新的规划,直至达到目标,而且,最终产生的规划可确保是合理可行的.4 航天器规划与调度问题求解这一节,我们将通过实例,说明我们是如何将规划与调度技术及交互集成技术应用于解决航天器的规划和调度问题的.4.1 航天器规划问题求解进行规划问题求解遇到的第一个问题就是如何对现实世界进行描述,也就是建立适当的规划模型.为此,我们做了如下工作:首先,引入时间线的概念,分别为状态时间线和活动时间线.对于每种可控部件,均要设置一条活动时间线与之对应.同样,根据需要,可以设置多条状态时间线.其次,设计了“状态参数管理器 “.航天器实际运行中有一系列数据来表征航天
9、器的运行状态.其中一部分表示航天器的各种需求,例如开启某个设备 i 需要耗费数量为 n 的资源 S 等,我们把这部分叫做参数;另一部分表示航天器的各种状态,例如资源 S 当前的可用量 ,以及设备 i 的开关状态等,我们把这部分叫做状态变量.状态参数管理器负责对这些状态变量和参数进行专门处理,另外,它也是联系规划系统和其他系统(数管系统,监控和故障诊断系统)的纽带.第三,活动表示的处理.活动是航天器规划的主体,也是引起航天器状态变量改变的主要原因.一般地讲,一个活动对应着一条指令(对底层规划来说),因此可以通过对活动的规划和调度完成航天器的飞行任务.下面是我们定义的部分活动:在用于规划的活动的定
10、义中,包含了参数和状态变量,活动的前提条件,活动的结果(即活动执行对状态变量的影响),活动的开始时间,结束时规划与调度集成技术在航天器自主运行中的应用 2007 年 6 月间,以及持续时间等信息.当日后需要对系统进行扩充或是应用于其他航天器时,只需按照已有标准,对现有状态参数管理器和活动库进行添加或修改即可.我们用 java 语言对此进行了实现.图 2.航天器活动库建模问题解决之后,剩下的问题就是当给定任务目标后,如何搜索出适当的活动去完成任务的问题.这里我们采用后向搜索的方式,应用和Best-First 策略相结合的方法去搜索解.由于篇幅所限,具体细节不在这里给出.图 3 所示是当任务目标为
11、“导航拍照 (星 1,设备 1)“时,经规划处理后挑选出的活动序列.活线厂厂图 3.底层规划产生的指令序列4.2 航天器调度问题求解航天器调度问题可以分为两类:一类是与航天器操控指令序列相关,一类是与之无关的(如法国的 SPOT 系列卫星的智能调度系统).前者是本文要解决的问题.经过前文的处理后,虽然可以将所需要的活动确定下来,但此时得到的活动序列是不能直接执行的,因为这个序列尚有许多冲突未解决(如图 4 所示).NASA 的做法是在规划器(planner)中集成了部分调度器(scheduler)的功能 .我们认为这样做难以充分利用目前已有的在规划领域和调度领域已取得的研究成果,并且需要专门编
12、写针对性极强的启发信息,降低了系统的通用性.因此,我们采用文献4中提供的“交互式集成方法“来处理这一问题.下面先对我们采取的调度算法作一简单说明.首先要将航天器自主控制问题独立为两个问题:一是规划问题,前文已经讨论过;二是调度问题.我们将航天器调度问题看作约束满足问题(CSP)来研究,首先需要将航天器调度问题建模成 CSP,然后利用约束传播和搜索技术进行求解.将已经选出的各个活动的开始时间作为 CSP 中的变量,其初始值域为全部时间空间,约束条件分为三类:1.全局约束.指全程都要满足的约束.例如能源使用量和存储用量必须在允许范围内;2.活动模型中定义的约束.例如在活动ObserveSWCali
13、brate 中,定义了关于姿态指向的约束:活动执行期间姿态要保持指向目标;3.规划过程中产生的约束.例如,活动按照规划产生的先后顺序执行.对于后向搜索,先产生的活动后执行.至此可以完成 CSP 问题的建模 ,进而采用各种约束传播和搜索算法进行求解即可.4.3 规划和调度问题的集成在上一节中,将自主控制问题分成了规划问题和调度问题,但如前文所述,必须将二者结合起来才能解决复杂的实际问题.下面说明如何使用交互集成方法解决这一问题.如前所述,这种方法采用交互的形式进行工作,在规划进行的过程中交错地进行调度.首先要确定的问题是何时进行规划,何时进行调度.为此,作如下规定:规定 1 初始状态下,系统的控
14、制权由规划系统掌握,此后,当 1 步规划完成后,控制权交给调度系统,调度系统完成调度工作后,将控制权交还规划系统进行进一步的规划:规定 2 在规划系统中,由当前节点出发,搜索产生深度为 1 的节点后,认为完成了 l 步规划.按照如上规定,规划与调度系统将按照如图4 所示算法进行求解:2007 年 6 月深空探测研究图 4.自主航天器问题求解算法Step1.从初始状态出发,分别引入不同的活动,规划器可以产生 n 个步长为 1 的部分规划 Pl,P2,I)n,同时通知控制模块:S 卸 2.控制模块接到规划器的通知后,按照一定的策略和优化标准确定其中一个规划,并能使调度器对该选定的规划进行约束验证和
15、资源分配,目前按照随机原则选取规划;Step3.调度器为选定的规划进行时间约束,资源约束以及其他约束的检验,若没有发现冲突,则对该规划进行必要的资源分配.如果检查出存在冲突,则通知控制模块提供其他规划;Step4.控制模块再次要求规划器对加工过的规划进行推理,产生下一步规划.重复以上过程,直至求得问题的解.最终得到的结果如图 5 所示.:,5 叫4叫25.O0;画:圆5 结论图 5.最终结果随着人类太空探索活动向着更深更远的方向发展,以及卫星编队飞行,降低航天器运行成本,增加数据返回等的要求,航天器自主控制技术将是未来航天器运行的发展趋势.本文在前人工作的基础上,应用交互式集成技术,针对航天器
16、问题,构建了自主规划与调度系统,并通过算例,介绍了它的工作过程.该系统能够充分利用已有的规划技术和调度技术,易于扩充和移植,用于解决航天器领域的自主控制问题是切实可行的.需要指出的是,目前的工作主要集中在验证该集成方法的有效性上,而没有过多地考虑系统的优化问题.如何制订更合理的启发策略和优化标准,是今后的工作重点.渗考文献1M.Lemailre,G.Verfaillie,F.Jouhaud,J.M.Lachiver,andNandN.Bataille.HowtoManagetheNewGenemtlonofAgileEarthObservationSatellites;A./nPOC.ofth
17、e6thInternationalSymposiumonSpaceOperationsattheStartofthe3rdMillennium,Toulouse,France,2000:37-45.2】Nayak,RBemard,D,E.DorMs,G.ValidatingtheDS1RemoteAgentexperimentA./nProceedingsoftheFifthInternationalSymposiumonArtificialIntelligence,RoboticsandAutomationforSpace沁越 RAs1,TheNetherlands:1999.3Chien,S,R.Sherwood,D.Tran,B.TheEO 一 1AutonomousScienceAgentA.Procofthe2004ConferenceonAutonomousAgentsandMulti-agentSystems,2004.4】Garrido,A.Barber,FIntegratingPlanningandSchedulingJ.AppliedArtificialIntelligence.AnInternationalJournal,2001,15:471-491.