变分法 (Calculus of Variations)

连理o

分类：学习笔记

发布时间 2023.11.08阅读数 959 评论数 0

Contents

泛函 (functional)
Calculus of Variations
References

泛函 (functional)

泛函 $F [y]$ 是函数的函数，即它的输入是函数 $y (x)$ ，输出是实数 $F$ 。这个输出值取决于一个或多个函数 (输入) 在一整个路径上的积分而非像一般函数一样取决于离散的变量。比如计算两点间的距离，输入是连接两点的曲线，输出是曲线长度。在 ML 的场景下，一个最常见的泛函就是熵 $H [x]$ ，熵的输入为随机变量 $x$ 的概率分布 $p (x)$ ，输出为实数，因此也可被写作 $H [p]$

Calculus of Variations

变分法就是找到一个函数 $y (x)$ 使得 $F [y]$ 最大/最小。例如找到两点间的最短路径为直线，使得微分熵最大的概率分布是正态分布

欧拉-拉格朗日方程

(1) 对于函数 $y (x)$ ，添加一个微小扰动 $ϵ→0\epsilon\rightarrow0$ 后用泰勒展开可得下式 (多项式的一阶导与原函数相同)
对于多变量函数 $y(x_1,…,x_D)$ ，泰勒展开式如下 (多项式的一阶偏导与原函数相同)
类似地，我们可以给泛函添加一个微小扰动 $ϵη(x)\epsilon\eta(x)$ 。通常在变分法中，泛函是一个积分，即
$F[y]=∫GdxF[y]=\int Gdx$ 因此给泛函添加一个微小扰动就相当于给积分路径上的无数个变量都添加了扰动，将多变量函数的泰勒展开进行推广可以得到泛函的泰勒展开式：
其中， $δF/δy(x)\delta F/\delta y(x)$ 为泛函 $F [y]$ 对 $y (x)$ 的导数
(2) $G$ 可以是函数 $y (x)$ 和 $y (x)$ 各阶导数的函数 (由于 $y (x)$ 是 $x$ 的函数，因此 $G$ 也是 $x$ 的函数)。为了说明方便，我们先姑且设 $G$ 是 $y (x)$ 和 $y^{'} (x)$ 的函数，所以我们可以将泛函写成：
给 $F [y]$ 一个扰动并用泰勒公式展开可以得到
$\begin{aligned} F [y (x) + ϵ η (x)] & = \int G (y + ϵ η, y^{'} + ϵ η^{'}, x) d x \\ = \int [G (y, y^{'}, x) + ϵ \frac{\partial G}{\partial y} η + ϵ \frac{\partial G}{\partial y^{'}} η^{'} + O (ϵ^{2})] d x \\ = F [y (x)] + ϵ \int [\frac{\partial G}{\partial y} η (x) + \frac{\partial G}{\partial y^{'}} η^{'} (x)] d x + O (ϵ^{2}) \end{aligned}$ $\begin{aligned} F[y(x)+\epsilon\eta(x)] &=\int G(y+\epsilon\eta,y’+\epsilon\eta’,x)dx \&=\int \left[G(y,y’,x)+\epsilon\frac{\partial G}{\partial y}\eta+\epsilon\frac{\partial G}{\partial y’}\eta’+O(\epsilon^2)\right]dx \&=F[y(x)]+\epsilon\int \left[\frac{\partial G}{\partial y}\eta(x)+\frac{\partial G}{\partial y’}\eta’(x)\right]dx+O(\epsilon^2) \end{aligned}$ 将第 2 项分部积分可以得到
$\begin{aligned} \int [\frac{\partial G}{\partial y^{'}} η^{'} (x)] d x & = \int \frac{\partial G}{\partial y^{'}} d η (x) \\ = {η (x) \frac{\partial G}{\partial y^{'}} |}_{x} - \int η (x) d \frac{\partial G}{\partial y^{'}} \\ = - \int \frac{d}{d x} (\frac{\partial G}{\partial y^{'}}) η (x) d x \end{aligned}$ $\begin{aligned} \int \left[\frac{\partial G}{\partial y’}\eta’(x)\right]dx &=\int \frac{\partial G}{\partial y’}d\eta(x) \&=\left.\eta(x)\frac{\partial G}{\partial y’}\right|_x-\int\eta(x)d \frac{\partial G}{\partial y’} \&=-\int\frac{d}{dx}\left(\frac{\partial G}{\partial y’}\right)\eta(x)d x \end{aligned}$ 其中最后一个等式是因为 $y (x)$ 的值在积分边界上是固定的，例如求两点间距离时，曲线在两个端点处的取值必须相同，因此扰动 $η(x)\eta(x)$ 在积分边界上值为 0， $F[y(x)+ϵη(x)]F[y(x)+\epsilon\eta(x)]$ 可写作下式：
(3) 对比 (1) (2) 中推得的式子可知
$δFδy(x)=∂G∂y−ddx(∂G∂y′)\frac{\delta F}{\delta y(x)}=\frac{\partial G}{\partial y}-\frac{d}{dx}\left(\frac{\partial G}{\partial y’}\right)$ 当 $y (x)$ 使得泛函 $F [y]$ 取极值时，对所有 $x$ 必有 $δFδy(x)=0\frac{\delta F}{\delta y(x)}=0$ ，这是因为假如存在 $x^\hat x$ 使得 $δFδy(x^)≠0\frac{\delta F}{\delta y(\hat x)}\neq0$ ，那么就可以取一函数 $η(x)\eta(x)$ 使得 $ϵη(x^)δFδy(x^)>0\epsilon\eta(\hat x)\frac{\delta F}{\delta y(\hat x)}>0$ 且当 $x≠x^x\neq\hat x$ 时有 $η(x)=0\eta(x)=0$ 。因此，可以推得下式，即欧拉-拉格朗日方程：
$∂G∂y−ddx(∂G∂y′)=0\frac{\partial G}{\partial y}-\frac{d}{dx}\left(\frac{\partial G}{\partial y’}\right)=0$ 例如，对于
欧拉-拉格朗日方程为
另外，如果 $G$ 只与 $y$ 有关，则欧拉-拉格朗日方程为 $∂G∂y(x)=0\frac{\partial G}{\partial y(x)}=0$ (对任意 $x$ 成立)

变分法示例：求两个固定点之间的最短路径

如上图所示路径是一任意路径，我们取区中一小段微元 $d s$ ，可以容易计算微元段的长度为：
$ds≈(dx)2+(dy)2=1+y′2dxds\approx\sqrt{(dx)^2+(dy)^2}=\sqrt{1+y’^2}dx$ 积分得到总的路径长度为：
$F[y]=∫x1x2ds=∫x1x21+y′2dxF[y]=\int_{x_1}^{x_2}ds=\int_{x_1}^{x_2}\sqrt{1+y’^2}dx$ 上述路径长度即为 $y$ 的泛函，其中 $G=1+y′2G=\sqrt{1+y’^2}$ ，因此有
$∂G∂y=0ddx(∂G∂y′)=ddx(y′1+y′2)=1+y′2y′′−y′y′1+y′2y′′1+y′2=y′′(1+y′2)32\frac{\partial G}{\partial y}=0\ \frac{d}{dx}\left(\frac{\partial G}{\partial y’}\right)=\frac{d}{dx}\left(\frac{y’}{\sqrt{1+y’^2}}\right)=\frac{\sqrt{1+y’^2}y’’-y’\frac{y’}{\sqrt{1+y’^2}}y’’}{{1+y’^2}}=\frac{y’’}{{(1+y’^2)^{\frac{3}{2}}}}$ 代入欧拉-拉格朗日方程可得
$y^{''} = 0$ 这个常微分方程很容易得到 $y$ 的通解为 $y=c_1x+c_2$ . 这也确实说明了使得同一平面上两点之间距离最小的途径是一条线段

References

Bishop, Christopher M., and Nasser M. Nasrabadi. Pattern recognition and machine learning. Vol. 4. No. 4. New York: springer, 2006.
【PRML】【模式识别和机器学习】【从零开始的公式推导】变分法
变分法简介 Part 1.（Calculus of Variations）
【变分计算1】欧拉-拉格朗日方程

机器学习经验分享 Entropy 数学推导

转载原出处：

打赏 0

上一篇：信息论 (Information Theory): Introduction and information measures

下一篇：重参数 (Reparameterization)

变分法 (Calculus of Variations)

连理o

泛函 (functional)

Calculus of Variations

References

为你推荐

【LVGL学习笔记】（五）使用SquareLine Studio设计UI

精选Cesium学习笔记6——加载倾斜摄影模型

精选免费可用的GPU

一个实例了解自动驾驶路径规划 —— （六）自动泊车代码中HybridA*算法的应用

【EasyExcel】Java将不同的.csv文件数据存入同一个.xlsx文件的不同sheet当中

inline内联函数速解

关于作者

连理o

27

0

150

2

重参数 (Reparameterization)

生成扩散模型 (Diffusion Models)

精选马尔可夫链蒙特卡罗法 (Markov Chain Monte Carlo, MCMC)

相关推荐

精选信息论 (Information Theory): Introduction and information measures

《视觉SLAM十四讲》编译报错问题汇总 Ubuntu20.04

ROS答疑（一）——如何进行时间同步操作

精选树莓派（一）树莓派的4种登陆方式

精选Django进行docker服务器部署

张量压缩感知---相关概念理解

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

变分法 (Calculus of Variations)

连理o

泛函 (functional)

Calculus of Variations

References

为你推荐

【LVGL学习笔记】（五）使用SquareLine Studio设计UI

精选Cesium学习笔记6——加载倾斜摄影模型

精选免费可用的GPU

一个实例了解自动驾驶路径规划 —— （六）自动泊车代码中HybridA*算法的应用

【EasyExcel】Java将不同的.csv文件数据存入同一个.xlsx文件的不同sheet当中

inline内联函数速解

评论（0）

关于作者

连理o

27

0

150

2

重参数 (Reparameterization)

生成扩散模型 (Diffusion Models)

精选马尔可夫链蒙特卡罗法 (Markov Chain Monte Carlo, MCMC)

相关推荐

精选信息论 (Information Theory): Introduction and information measures

《视觉SLAM十四讲》 编译报错问题汇总 Ubuntu20.04

ROS答疑（一）——如何进行时间同步操作

精选树莓派（一）树莓派的4种登陆方式

精选Django进行docker服务器部署

张量压缩感知---相关概念理解

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

《视觉SLAM十四讲》编译报错问题汇总 Ubuntu20.04

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板