经典DMP的问题及其解决办法

沙漏

分类：运动控制

发布时间 2021.11.28阅读数 3865 评论数 0

1. 经典DMP的问题

本文是上一篇文章的续文，文章地址：

Dynamic Movement Primitives介绍及Python实现与UR5机械臂仿真

本文目的在于介绍经典DMP的问题及其解决办法。同样地，所有的源代码均开源，详见：

chauby/PyDMPs_Chaubygithub.com/chauby/PyDMPs_Chauby

首先，我们还是从这个基本的DMP公式出发：

$\tau^2 \ddot y = \alpha_y(\beta_y(g-y)-\tau \dot y) + (g-y_0)f$

其中，非线性项 $f$ 为：

$f(x)=\frac{\sum_{i=1}^{N} \Psi_{i}(x) w_{i} x}{\sum_{i=1}^{N} \Psi_{i}(x)}$

其中， $\Psi_i$ 是基函数，对于离散型的DMP来说是高斯基函数，对于节律型的DMP来说是冯米塞斯函数。 $w_i$ 是对应基函数的权重。 $x$ 来自于一个一阶系统：

$\tau \dot x = - \alpha_x x \label{cs}$

其中， $\alpha_x$ 是一个常数。

给定示教轨迹 $[y_{demo}, \dot y_{demo}, \ddot y_{demo}]$ ，则我们可以求得需要拟合的非线性函数为：

$f_{target} = \frac{\tau^2 \ddot y_{demo} - \alpha_y(\beta_y(g-y_{demo})-\tau \dot y_{demo})}{g-y_0}$

构造损失函数：

$J_i = \sum^P_{t=1} \Psi_i(t) (f_{target}(t) - w_i \xi(t))^2$

求解损失函数可得到非线性项 $f$ 的权重值。损失函数的求解过程，这里不再细讲，读者可以参考我们的上一篇文章。

对于上面这个最原始的DMP来说，是有一些问题的，我们以离散型DMP为例，主要有以下2个问题：

从第一个公式我们可以看到，如果示教轨迹的起始点 $y_0$ 和目标位置 $g$ 非常接近，那么 $g-y_0$ 就趋于零，则 $(g-y_0)f$ 这一项也趋于零， $f$ 项本身是什么样已经不重要了，因此失去意义；
从 $f_{target}$ 的计算公式我们可以看到，当 $g-y_0$ 趋于零的时候，分母趋于零，我们无法计算 $f_{target}$ ，也就会导致示教轨迹的形状无法被 $f$ 建模。就算我们通过在分母上添加一个极小的值 $\epsilon$ 来解决除数为零的情况，则一旦新的目标位置与示教的目标位置偏差一点就会让幅值产生极大的变化，甚至是放缩的符号相反导致轨迹形状复现出镜像效果，无法得到正确的放缩轨迹。

这里有一个简单的例子，对于一个周期的正弦曲线，其轨迹的起点和终点相同，DMP的建模结果如下图所示：

图中，设定的目标位置为1e-15，与原始示教轨迹的目标位置 $0$ 相比只变动了一点点，但是结果导致了复现的轨迹“镜像”且幅值放缩巨大

这个问题最直接的后果就是经典的DMP无法拟合起点终点非常接近的曲线，对于多维度的曲线拟合来说，其中任何一个维度存在这个问题就会导致整条曲线拟合失真，轨迹无法被复现。例如，我们拟合一个机械臂从桌面拿起东西再放回桌面，那么示教轨迹在 $Z$ 轴方向的分量就是一个起点和终点非常接近的情况。

2. 改进型DMP

那么，有什么办法可解决这个问题呢？Stefan Schaal等人在其2008年的一篇论文（见文末的参考文献）中，给出了一种解决办法。既然在DMP的公式中， $(g-y_0)f$ 无法直接使用了，那我们就想办法转变一下来避免这个问题。我们既要通过 $g-y_0$ 来计算曲线的放缩“幅值”，便于适应不同的任务场合，又要使用 $f$ 来建模曲线的“形状信息”，那么我们就想办法把两者分开，让他们分别独立起作用就好了。

因此，在改进型的DMP中，我们把经典的DMP公式改写为：

$\tau^2 \ddot y = \alpha_y(\beta_y(g-y)-\tau \dot y) + Kf - K x (g-y_0)$

其中， $K$ 是一个常数（这里为了与系统的参数保持一致，我们取 $K=\alpha_y$ ）， $f$ 依旧使用前面那个 $f$ 的表达式， $x$ 来自一阶系统。我们可以分开来理解，上面这个公式右边的第一项是PD控制器；第二项是轨迹形状拟合器，当 $y$ 趋近于目标状态 $g$ 的时候（ $x$ 趋于零）这一项趋于零；第三项是幅值放缩器，通过 $g-y_0$ 来计算幅值的放缩量，同样地，当 $x$ 趋于零的时候这一项趋于零，趋于稳定。

这样，给定示教轨迹的时候， $f_{target}$ 就重新定义为：

$f_{target}=\frac{\tau^2 \ddot y_{demo} - \alpha_y(\beta_y(g-y_{demo})-\tau \dot y_{demo})}{K} + x(g-y_0)$

其中，DMP在学习示教轨迹的时候不需要进行时间放缩，因此 $\tau=1.0$ ，使用与经典DMP同样的方式来构造损失函数，求解过程与之前保持一致。

现在，我们来看看实验结果：

图中的两条示教曲线都是起点和终点重合的轨迹，改进型的DMP可以完美的学习得到轨迹的参数，并且对于给定的新的目标位置也能精确地复现轨迹去达到要求。

参考文献

2008-Movement reproduction and obstacle avoidance with dynamic movement primitives and potential fields | IEEE Conference Publication | IEEE Xplore

上述参考文献也已经放进了源代码的paper路径下。如果看完了觉得对你有帮助，欢迎点赞和转发分享。

DMP 动态规划非线性插值

打赏 0

上一篇：Dynamic Movement Primitives介绍及Python实现与UR5机械臂仿真

下一篇：【双足机器人（3）】3D线性倒立摆Python仿真（附代码）

经典DMP的问题及其解决办法

沙漏

1. 经典DMP的问题

2. 改进型DMP

参考文献

为你推荐

6轴并联机器人，6轴运动展示

差分轮移动机器人模型预测控制MPC

柔顺控制---原理介绍(一)

机器人智能仿生路径规划算法研究现状简述

细品波士顿动力SpotMini-1

多旋翼无人机仿真 rotors_simulator：roll pitch yawrate thrust 控制器

关于作者

沙漏

15

0

14

3

平滑轨迹插值方法之多项式插值（附代码）

CoppeliaSim中力（矩）传感器的方向问题

经典DMP的问题及其解决办法

相关推荐

最优控制问题数值方法-间接法/变分法 (11)

[Astar_algorithm07]技术文档_Graph

详谈麦克纳姆轮（二）

PID的TRICK(一)简述五种PID积分抗饱和（ANTI-Windup）方法

滑模控制理论（SMC）概述

最优控制问题数值方法-间接法/变分法 (9)

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

经典DMP的问题及其解决办法

沙漏

1. 经典DMP的问题

2. 改进型DMP

参考文献

为你推荐

6轴并联机器人，6轴运动展示

差分轮移动机器人模型预测控制MPC

柔顺控制---原理介绍(一)

机器人智能仿生路径规划算法研究现状简述

细品波士顿动力SpotMini-1

多旋翼无人机仿真 rotors_simulator：roll pitch yawrate thrust 控制器

评论（0）

关于作者

沙漏

15

0

14

3

平滑轨迹插值方法之多项式插值（附代码）

CoppeliaSim中力（矩）传感器的方向问题

经典DMP的问题及其解决办法

相关推荐

最优控制问题数值方法-间接法/变分法 (11)

[Astar_algorithm07]技术文档_Graph

详谈麦克纳姆轮（二）

PID的TRICK(一)简述五种PID积分抗饱和（ANTI-Windup）方法

滑模控制理论（SMC）概述

最优控制问题数值方法-间接法/变分法 (9)

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板