1、立方机器人:一个可以跳跃和平衡的立方体摘要:这篇文章介绍了一个 15x15x15cm 可以跳跃和可以靠一角保持平衡的立方体。飞轮安装于立方体的三个面上如图 1 所示,以高角速度转动并紧急制动,来让立方体机器人跳跃。曾经这立方机器人即将达到以一角保持平衡的位置,控制电机扭矩可以保持它利用一角保持平衡。这篇文章延续着立方体机器人在 ETH 苏黎世和现有预算结果的三维模型发展。1 介绍倒立摆系统有着丰富的历史并且已经管饭的运用于测试,演示和检测新的控制概念和理论。此外,倒立系统本身新控制算法的发展仍然是一个活跃的探索领域。相比于其他的 3D 倒立摆测试平台,这立方体机器人有两个独特的特征。其中一个是
2、它相对小的步态, (因此它叫立方体机器人,这源于瑞典的德语“立方体”的小型) 。另一点在于他可以静止没有其他来自另外支撑的跳跃位姿,不仅是一个有趣的控制概念并且是一个对普通大众有吸引力的演示效果。图 1 去除盖子的立方体机器人 CAD 图纸图 2 显示了立方体机器人的跳跃方式。最初立方体机器人以一面平放地面,将通过它的边缘来跳跃,并通过及时制动其飞轮。一旦立方体机器人通过其一边来平衡,接下来的两个轮子都是瞬间制动,让它利用他一角来站立。最后,惯性测试单元(IMU)基于状态估计将会执行,同时电机扭矩将会精确的控制来让立方机器人持续站立。然而研究的一大部分就是尽量避免影响或者克服它的影响10-12
3、,只有一小部分13,包括立方体机器人,利用它的影响。然而无冲击的力是被执行机构的扭矩范围限制的,一个来自力的影响是远远超出了执行力的局限性。图 2 立方体机器人的跳跃方式:(a)以一边平躺:最初以一面平躺,这立方体机器人跳起来通过他的一边来站立。 (b)一边平衡到一角平衡:这立方体机器人从通过一边的平衡转换到通过一角来平衡。一旦完成,这个立方体机器人将提供一个廉价,开源具有相对小步态的测试平台来在估计和控制领域的研究和教育。立方体机器人的三维模型设计开始于以下的问题:如何建立一个 15 厘米为边长的立方体,并其可以实现跳跃和利用其一角来平衡的功能,使用现成的电机、电池、电子元器件呢?由于结构的
4、刚度和现有的组件的约束,只有在飞轮允许的条件下设计质量分布特性灵活的立方体。跳跃时必要的飞轮的角速度是在车轮和摆动体间的一个完全无弹性计算的假设。虽然在制动之前飞轮拥有高的角速度会被通过增加转动惯量的减少。增加飞轮最大的质量虽然飞轮的尺寸大小是被限制的。这不是走向一个极端,因为这样会导致减少恢复的角度而平衡。飞轮与电机之间的齿链是需要避免的,因为它不允许在较高的角速度下的跳跃,同时那样会增加额外的重量和体积。虽然保持平衡的动作,这需要较高扭矩,这被采用无齿轮的选择所影响,无刷直流电机仍能提供足够的扭矩来恢复角度高达 7。本文的目的是提出一个三维立方体机器人的概念与一个三维模型设计的发展,模型,
5、识别和控制。这篇文章也展示了一个消除平衡机动过程中传感器的偏移的控制理念。2 三维模型图片 3 说明了一个建造来测试立方体机器人灵活度和发展控制理念的三维模型。相似动量交换轮基于倒立摆的设计,除了制动机制以外,还可以在 5 中找到 7 。原型包括持有动量交换的正方形塑料板,飞轮通过电机在其中心和制动机制使它可以通过一角来站立。塑料的尺寸板与该立方体机器人一个面的尺寸想符合,这将被称为以后的钟摆机构。这个塑料板是连接在底部轴承上的,这给它单自由度来使它在一个角落里绕着它的角落水平面转动。A 系统动力图 3 由一个正方形组成的一维原型的其重心在其中心,通过电机保持动量交换轮的塑料板的重心在其中心。
6、这个塑料板是安装于轴承底部的。让 来表示摆体的倾斜角度, 代表旋转位移的飞轮与摆体的夹角。非线性动力学给出了b图 3 所示坐标下的动力学方程,sin)( )( ,sin222lmICgllITIlICglmlbbbbbmbbbb 定义 , 为摆动体和飞轮的质量, 为摆动体绕支点的转动惯量, 为飞轮绕电动机转bbI I子为转轴的转动惯量, 为电机轴到支点之间的距离, 为摆体质量中心和 支点之间的距离,l blbCg=9.81 为重力加速度, 为电机产生的扭矩,同时 ,为钟摆体和飞轮之间的动态摩擦系2smmT数。因为我们使用了一个电机,允许电流设定点控制在 10Hz 的内部循环,目前的转矩关系可以
7、建模为(2),uKTm当 14为所用的无刷直流电动机的转矩常数,并且 为电流值。1301.5AN u输入B 参数识别本节介绍了确定(1)不能直接测量的参数的程序。是用来识别自由悬挂摆体偏向的不同角度。为识别 和 ,在飞轮以不同的速度驱动时,bl IC而摆身体直挺挺地固定,同时 的痕迹被记录。通过最小二乘法来测量tCtuKtIm可得到 和 。为识别 和 ,经过严格的飞轮和摆体整体安装倒挂了摆动。通过最小二乘法来测量bI tglmlttl bbbb sin)()(2可得到 和 。下面的表格可以显示所有测量和计算得到的参数值:bICC 制动机制图 4,说明了刹车机制的全部原理。金属栅栏和 RC 伺服
8、器使用薄的金属板连接,以确保大部分的冲击由金属栅栏承受。此外,该设计确保了金属栅栏可以轻易更换。使用 RC 伺服器的制动机制相较于传统的基于螺旋线圈的制动机制,在质量(少了 39g),供电和耐用性上都有一些优势。为了测试制动机制的耐用性和选择合适的金属作为金属栅栏,做了如下的测试,在摆动体上固定了些额外的钢板,以使得整体的质量及惯性与完整的立方体机器人在做边缘起跳时相等。如图 8所示。图 4. 使用 RC 伺服器的制动机制的 CAD 绘图:一个 RC 伺服器用以将一个金属栅栏(蓝色)与动力轮上的螺栓头(红色)快速碰撞。D电子和软件为防止第一个模型太过复杂,在一维模型制作时,电源,计算和控制的元
9、件并没有被安装到整体上去。图 5 表明了除电源以外的全部的电子元件配置。电源采用恒压源。图 5 电子装置示意图因为意法半导体的 STM3210E (Cortex-M3 内核,72MHz 时钟)开发板拥有快速开发原型和高效的社区支持,我们选择其作为主控芯片。IMU(Inertial Measurement Unit,惯性测量单元)由Analog Devices(美国模拟器件公司)的三轴加速度计 ADXL345 和 InvenSense(美国应美盛公司)的三轴陀螺 IDG-500/ISZ-500 组成。这两个 IMU,挂在如图 6 所示的摆动体的相应位置上。使用两组分立 SPI 总线与开发板相连。
10、使用一个 50 瓦的直流无刷电机,EC-45-flat,从 MAXON 电机被选为驱动的飞轮为其提供动能,与刷直流相比,它们是高能量密度的马达。嵌入式霍尔传感器的电机被用于测量飞轮转速, ,传感。电机控制使用现成的数字四象限电机控制器 EPOS250/5,来自 MAXON 公司。CANopen 协议用于电机控制器与电机控制器之间的通信板。注意,立方体机器人的微型上述控制器版本,12 月模块 36 / 2,将被使用。刹车机制的 RC 伺服器 HSG-5084MG,由开发板给出的 PPM 信号驱动。为了便于调 STM32 搭载FreeRTOS(类似 uc/os 的操作系统)调度程序,用于软件框架中
11、。因其调度器所提供的区分优先级的多任务处理功能,以及其内核占用空间小(4KB) 。ODeV 是基于 Eclipse IDE 开发的完整的且免费的嵌入式系统开发环境,我们使用它作为软件的开发工具。 3、估算与控制A、基于 IMU 估算倾斜角度和 IMU 调零为了估计摆动体的倾斜角度 ,仅使用两个加速度计可以实现基于加速度的倾斜估计。注意该b方法可以扩展到立方体机器人的的 3D 倾斜估计。两个加速度计被安置在摆动体沿着多角线方向,与旋转中心距离 ,如图 6 所示。最灵2,1ir敏的两个测量轴线 放置在摆动体平面上, 指向切线方向, 指向旋转方向。这种安iiyxeb, ixebiyeb装方式,测量出
12、的加速度计 i(i=1,2)的数值,在加速度计坐标系内应当满足如下所给出的公式: ),0cos,sin(: 2bbibbii grgrma .2,1i动态关系可以消去: )0,(: ),)1(,i121 yx bbam其中 ,21/r估计摆动体的倾斜角度由公式 给出。)/(tan1: yxbm以下的步骤可以鉴别出加速度计在机械定位上的错误:在多个倾斜角度下( ) ,固定摆动体 ,记录加速度计的测量值。4/,/b )0(b做原理组成分析,以找到符合加速度计坐标系的旋转平面。使测量深入到旋转平面,定义一个参考坐标系,以计算定向偏移。图 6,图为使用了两个加速度计来估算摆动体倾斜情况下的示意图。两个
13、加速度计放置在沿着摆动体对角线方向,距离旋转中心为 ri(i=1,2)的位置。距离的比值被用来排除测量过程中的动态关系B、起跳过程假定这是一次完美的非弹性碰撞,零回弹系数,起跳所需的动量轮的角速度 这样来计算在碰撞中角动量的转换 bblmII 2其中 为摆动体碰撞后的角速度。b碰撞后能量的转换 ,到摆动体到达顶点)4/(b )0(b21(212glllIbbb 两边消去(3)glmIlbb)()()(2参数中的不确定因素或者非零的回弹系数会使得 脱离计算值。如果这样,利用 碰撞后b的单调性和 ,可以应用简单的二分法尝试和错误学习步骤到这里来找到所需要的 ,公 式(3)中所给出的 可以用做最开始
14、的调解中。在碰撞后,一旦摆动体到达平衡位置附件,基于 LQR(线性二次调节器)的控制器,接下来的章节会介绍的,将会开始平衡系统。C、平衡控制将 线性化)0,(),(b)( 4).()(tButAxt当 ,:,b )(0)(0: 22lmIClmIglAbbb )(0:2lmIKBb一个 20 毫秒的采样时间被选定为数字控制,针对开环不稳定杆(4) (637:4 MS)和安全系数为 30。使用该采样时间使用(4)的连续时间系统进行了离散化零级保持和由此产生的离散时间模型通过 )5(,10NkkuBxAkdd 当 和 是连续时间状态矩阵和输入矩阵 B 的离散时间的连续状态。为了研究我们用简单的d符
15、号来代表相同的连续和离散版本的 x 和输入状态 u。 使用上述的离散时间模型,线性二次型调节器(LQR)的形式反馈控制器被设计出来。 )6(),(kKkubd当 为 LQR 反馈增益,最大限度地减少了成本函数。),3,21d ,0,:)(1 RQkRukQxuJkTT是速度陀螺仪的角速度估计量, 是霍尔传感器的飞轮角速度估计量。图 9 说明(6)下的b 平衡性能。从图中可以看出,系统的估计状态收敛 。这种行为可以)0.37,58.(),(b被解释为以下属性的系统: ,0)7(),()( 313 mddd KCBKAI当 为尺寸 3 的恒等矩阵,此属性的物理解释是,如果 AD、BD、和 KD 给
16、出一个稳定的系统,3I在测量任何常数偏移会导致稳定状态下的一个非零的轮速。使用连接到摆体在枢轴点的绝对编码器的读数,我们定位的偏移在倾斜角度和偏移内的倾斜角度估计量为 .,)/(tan:1 Rddmbyxb 为了自动消除上述恒定的倾斜角度偏移,在(5)中给出的离散时间系统进行了扩展通过引入一个低通滤波器和状态 和下面的动力学方程kf )8(,0,)1( fbff xkxkx当 同时控制器修改为),0 )9().,( kxkKkubfbd由闭环系统(5) 、 (8)和(9)是稳定为 。现在让 表示系统的稳02),:,fbx定状态,这是解决问题的方法为 ).()1(1dxxBAbff fdd这与(
17、8)得出 )10()(0)()(311fmdfddxKCKI)().()(xbff 最后, (10)和(11)得到 显示系统达到理想的平衡状态和滤波器状态,0,d收敛于倾斜角度的偏移量与所提出的控制器。虽然零均值传感器噪声的测量,避免在制定的简单,结果仍然是有效的减小这种类型的噪声。图片 10 显示一个平衡实验与偏移校正。估计状态 收敛于 同时滤波器状),(b)0,58.(态 收敛的偏移值为-0.058 度。图片 11 显示一个平衡的实验系统在外部干扰的时间 t=26s。最后,fx此外,图片 12 显示了完整的跳跃和平衡动作开始在 停止。4/b图片 7 图片一开始时一维状态下平衡图 8. 该图
18、显示了另一个一维模型,在其摆动体左侧增加了一块额外的负重,用来测试制动机制的耐用性。加上所有负重后,便能模拟完整的立方体边缘起跳的过程,质量和惯性对于制动机制来说至关重要的环节图 9 时间痕迹的三维模型在平衡运行期间不进行偏移校正的状态估计角度。4、致谢作者要感谢 Sebastian Trimpe 和 Raymond Oung 提供的所有支持和讨论分享他们在构建平衡立方体的经验9,以及分布式飞行阵列 17 。此外,作者还要另外感谢来自 Philipp Reist 基于理念影响跳跃的策略,Carolina Flores 对于图形上的帮助和 Tobias Widmer 在实验方面的帮助。参考文献1
19、 A. Stephenson, “On a new type of dynamical stability,” Proceedings:Manchester Literary and Philosophical Society, vol. 52, pp. pp. 110,1908.2 P. Reist and R. Tedrake, “Simulation-based lqr-trees with input and state constraints,” in Robotics and Automation (ICRA), 2010 IEEE International Conference
20、 on, may 2010, pp. 5504 5510.3 D. Alonso, E. Paolini, and J. Moiola, “Controlling an inverted pendulum with bounded controls,” in Dynamics, Bifurcations, and Control,ser. Lecture Notes in Control and Information Sciences. SpringerBerlin / Heidelberg, 2002, vol. 273, pp. 316.4 M. V. Bartuccelli, G. G
21、entile, and K. V. Georgiou, “On the stability of the upside-down pendulum with damping,” Proceedings: Mathematical, Physical and Engineering Sciences, vol. 458, no. 2018, pp. pp.255269, 2002.5 J. Meyer, N. Delson, and R. de Callafon, “Design, modeling and stabilization of a moment exchange based inv
22、erted pendulum,” in 15h IFAC Symposium on System Identication, Saint-Malo, France, 2009,pp. 462 467.6 B. Andrievsky, “Global stabilization of the unstable reaction-wheel pendulum,” Automation and Remote Control,vol.72,pp.1981-1993,2011.Online.Available:http:/dx.doi.org/10.1134/S00051179110901897 A.
23、Beznos, A. Grishin, A. Lenskij, D. Okhotsimskij, and A. For-malskij, “A ywheel use-based control for a pendulum with a xed suspension point,” . , no. 1, pp. 2738, 2004.8 D. Bernstein, N. McClamroch, and A. Bloch, “Development of air spindle and triaxial air bearing testbeds for spacecraft dynamics a
24、nd control experiments,” in American Control Conference, 2001.Proceedings of the 2001, vol. 5, 2001, pp. 3967 3972 vol.5.9 S. Trimpe and R. DAndrea, “Accelerometer-based tilt estimation of a rigid body with only rotational degrees of freedom,” in Robotics and Automation (ICRA), 2010 IEEE Internation
25、al Conference on, May 2010, pp. 2630 2636.10 D. N. Nenchev and K. Yoshida, “Impact analysis and post-impact motion control issues of a free-oating space robot subject to a force impulse,” IEEE Transactions on Robotics and Automation,vol. 15, no. 3, pp. 548557, 1999. Online. Available: http:/ieeexplo
26、re.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=76818611 T.-J. Tarn, Y. Wu, N. Xi, and A. Isidori, “Force regulation and contact transition control,” Control Systems, IEEE, vol. 16, no. 1, pp. 32 40,feb 1996.12 P. Pagilla and B. Yu, “An experimental study of planar impact of a robot manipulator,” Mec
27、hatronics, IEEE/ASME Transactions on,vol. 9, no. 1, pp. 123 128, march 2004.13 A. Konno, T. Myojin, T. Matsumoto, T. Tsujita, and M. Uchiyama,“An impact dynamics model and sequential optimization togenerate impact motions for a humanoid robot,” Int. J. Rob. Res.,vol. 30, no. 13, pp. 15961608, Nov. 2
28、011. Online. Available:http:/dx.doi.org/10.1177/027836491140587014 (2012, Feb) Maxon motor ag, maxon motor catalog, ec-45-at.Online. Available: http:/ (2012, Feb) Rotary and linear motion sensors (rls), re36. Online.Available: http:/www.rls.si/document/RE36D01.pdf16 S. Oliveri. (2012, Feb) Open development environment for embedded application. Online. Available: http:/www.stf12.org/developers/ODeV.html17 R. Oung and R. DAndrea, “The distributed ight array,” Mechatronics,vol. 21, no. 6, pp. 908 917, 2011. Online. Available:http:/