微积分笔记（41）——多变量函数的微分学（4）

wzf2000
2020年4月12日

微积分笔记（41）——多变量函数的微分学（4）

多变量函数的微分学

多元函数的多项式逼近

回忆

用一元多项式逼近一元函数，也就是利用 Taylor 公式。

现在希望用 $n$ 元多项式逼近 $n$ 元函数。

多项式逼近问题

设 $n$ 元函数 $f(\mathbf{x})$ 可微，则：
$$
f(\mathbf{a} + \Delta \mathbf{x}) = f(\mathbf{a}) + \sum_{i = 1}^n D_i f(\mathbf{a}) \Delta x_i + o(\| \Delta \mathbf{x} \|)
$$
若上面 $f(\mathbf{x})$ 在 $\mathbf{a}$ 点有 $m + 1$ 阶连续偏导数，是否有 $m$ 次多项式 $P_m(\mathbf{x})$，使得：
$$
f(\mathbf{a} + \Delta \mathbf{x}) = P_m(\Delta \mathbf{x}) + o(\| \Delta \mathbf{x} \|^m)
$$
若答案肯定，如何求 $P_m(\mathbf{x})$。

方法（将 $n$ 元函数化为 $1$ 元函数情况）

设 $f \in C^{m + 1}(B_r(\mathbf{a})), \mathbf{a} \in \mathbb{R}^n, r > 0, \forall \Delta \mathbf{x} \in \mathbb{R}^n, \| \Delta \mathbf{x} \| < r$，定义： $$ \varphi(t) = f(\mathbf{a} + t \Delta \mathbf{x}) \in C^{m + 1}[0, 1] $$ 应用一元函数的 Taylor 公式：$\forall t \in [0, 1], \exists \theta \in [0, 1]$： $$ \varphi(t) = \sum_{k = 1}^m \frac{\varphi^{(k)}(0)}{k!} t^k + \frac{\varphi^{(m + 1)}(\theta t)}{(m + 1)!} t^{m + 1} $$ 特别取 $t = 1$ 得到： $$ \varphi(1) = \sum_{k = 1}^m \frac{\varphi^{(k)}(0)}{k!} + \frac{\varphi^{(m + 1)}(\theta)}{(m + 1)!} \tag{1} $$ 下面将引入的 $1$ 元函数回到 $n$ 元函数 $f$ 的表达式。已知 $\varphi(t) = f(\mathbf{a} + t \Delta \mathbf{x}) \in C^{m + 1}[0, 1], \exists \theta \in (0, 1)$ 有上面结论成立。其中： $$ \varphi(1) = f(\mathbf{a} + \Delta \mathbf{x}), \varphi(0) = f(\mathbf{a}) $$ 并且： $$ \varphi^\prime(t) = \sum_{i = 1}^n \frac{\partial f(\mathbf{a} + t \Delta \mathbf{x})}{\partial x_i} \Delta x_i, \varphi^\prime(0) = \sum_{i = 1}^n \frac{\partial f(\mathbf{a})}{\partial x_i} \Delta x_i \\ \varphi^{\prime\prime}(t) = \sum_{i, j = 1}^n \frac{\partial^2 f(\mathbf{a} + t \Delta \mathbf{x})}{\partial x_i \partial x_j} \Delta x_i \Delta x_j, \cdots \cdots $$ 带回 $(1)$ 即可得 Taylor 公式。

Taylor 公式（$C^2$ 函数的多项式逼近）

设 $f \in C^2(B_r(\mathbf{a})), \mathbf{a} \in \mathbb{R}^n, r > 0$，则 $\forall \| \Delta \mathbf{x} \| < r, \exists \theta \in (0, 1)$： $$ f(\mathbf{a} + \Delta \mathbf{x}) = f(\mathbf{a}) + \sum_{i = 1}^n \frac{\partial f(\mathbf{a})}{\partial x_i} \Delta x_i + \frac{1}{2} \sum_{i, j = 1}^n \frac{\partial^2 f(\mathbf{a} + \theta \Delta \mathbf{x})}{\partial x_i \partial x_j} \Delta x_i \Delta x_j $$ 为简化表达式，引入 Hesse 矩阵： $$ Hf(\mathbf{x}) := \begin{pmatrix} D_1 D_1 f(\mathbf{x}) & \cdots & D_1 D_n f(\mathbf{x}) \\ \vdots & \ddots & \vdots \\ D_n D_1 f(\mathbf{x}) & \cdots & D_n D_n f(\mathbf{x}) \end{pmatrix}_{n \times n} $$ 综上可以得到以下 $2$ 种 Taylor 多项式逼近公式： $$ f(\mathbf{a} + \Delta \mathbf{x}) = f(\mathbf{a}) + Jf(\mathbf{a}) \Delta \mathbf{x} + \frac{1}{2} (\Delta \mathbf{x})^T Hf(\mathbf{a}) \Delta \mathbf{x} + o(\| \Delta \mathbf{x} \|^2) \tag{2} \\ $$$$ f(\mathbf{a} + \Delta \mathbf{x}) = f(\mathbf{a}) + Jf(\mathbf{a}) \Delta \mathbf{x} + \frac{1}{2} (\Delta \mathbf{x})^T Hf(\mathbf{a} + \theta \Delta \mathbf{x}) \Delta \mathbf{x} \tag{3} $$其中 $(2)$ 为带 Peano 型余项，$(3)$ 为带 Lagrange 型余项，其中 $\theta \in (0, 1)$。上面公式采用了矩阵记号与运算约定。证明：只须注意 $(\Delta \mathbf{x})^T [Hf(\mathbf{a} + \theta \Delta \mathbf{x}) – Hf(\mathbf{a})] \Delta \mathbf{x} = o(\| \Delta \mathbf{x} \|^2)$。$\square$

多元函数的极值问题

极值问题

求函数的极大极小值，最大最小值，是 Taylor 公式的一个应用。

极值（局部最值）

设 $f : D \to \mathbb{R}, \mathbf{a} \in D^\circ$：

$f(\mathbf{a})$ 是极大值：$\exists r > 0, \forall \| \mathbf{x} – \mathbf{a} \| < r, f(\mathbf{x}) \le f(\mathbf{a})$。
$f(\mathbf{a})$ 是极小值：$\exists r > 0, \forall \| \mathbf{x} – \mathbf{a} \| < r, f(\mathbf{x}) \ge f(\mathbf{a})$。

（严格极值定义略）

若 $f(\mathbf{a})$ 是极大值或极小值，则称 $\mathbf{a}$ 为极大值点或极小值点。

极值必要条件

设 $f$ 在 $\mathbf{a}$ 点达到极值且 $D_\mathbf{u} f$ 存在，则 $D_\mathbf{u}(\mathbf{a}) = 0$；
若 $f$ 在 $\mathbf{a}$ 点达到极值且可微，则 $Jf(\mathbf{a}) = \mathbf{0}$，也即 $D_i f(\mathbf{a}) = 0, i = 1, 2, \cdots, n$。

驻点-临界点

若函数 $Jf(\mathbf{a}) = \mathbf{0}$，则称 $\mathbf{a}$ 称 $f$ 的驻点（也称临界点）。

注：

在有些文献中，不可微点也被称为临界点。
可微函数仅在驻点达到极值，但反之不比成立。

对于 $f(x, y) = x^2 – y^2$，原点是驻点，但是原点并非极值点。

极值的充分条件

如果 $\mathbf{a}$ 是 $f(\mathbf{x})$ 的驻点，则根据 Taylor 公式，可知 $\mathbf{a}$ 是否极值点由 Hesse 矩阵 $Hf$ 的性质决定。

如果 $\exists r > 0, f \in C^2(B_r(\mathbf{a}))$，则：

若 $Hf$ 正定，则 $f(\mathbf{a})$ 为严格极小值。
若 $Hf$ 负定，则 $f(\mathbf{a})$ 为严格极大值。
若 $Hf$ 不定，则 $f(\mathbf{a})$ 不是极值。

证明：如前观察，已知 $Hf(\mathbf{a})$ 正定，其特征值全部大于 $0$，由连续性可知 $\mathbf{x} = \mathbf{a}$ 附近 $Hf(\mathbf{x})$ 也正定，由此导出第一条。

第二条与第一条完全平行。

对于第三条，论证基于：
$$
f(\mathbf{a} + \Delta \mathbf{x}) = f(\mathbf{a}) + \frac{1}{2} (\Delta \mathbf{x})^T Hf(\mathbf{a}) \Delta \mathbf{x} + o(\| \Delta \mathbf{x} \|^2) \tag{2} \\
$$
已知矩阵 $Hf(\mathbf{a})$ 不定：$\exists \mathbf{u}, \mathbf{v} \in \mathbb{R}^n, \| \mathbf{u} \| = \| \mathbf{v} \| = 1$：
$$
\mathbf{u}^T Hf(\mathbf{a}) \mathbf{u} > 0 > \mathbf{v}^T Hf(\mathbf{a}) \mathbf{v}
$$
特别有：
$$
f(\mathbf{a} + t \mathbf{u}) = f(\mathbf{a}) + \frac{t^2}{2} \left( \mathbf{u}^T Hf(\mathbf{a}) \mathbf{u} \right) + o(t^2) \\
f(\mathbf{a} + t \mathbf{v}) = f(\mathbf{a}) + \frac{t^2}{2} \left( \mathbf{v}^T Hf(\mathbf{a}) \mathbf{v} \right) + o(t^2)
$$
因此当 $t$ 充分小时：
$$
f(\mathbf{a} + t \mathbf{u}) > f(\mathbf{a}) > f(\mathbf{a} + t \mathbf{v})
$$
即 $f(\mathbf{a})$ 不是极值。$\square$

$2$ 元函数的极值判别

设 $\mathbf{a}$ 是 $f(x, y)$ 的驻点且 $\exists r > 0, f \in C^2(B_r(\mathbf{a}))$，记：
$$
A = \frac{\partial^2 f}{\partial x^2} (\mathbf{a}), B = \frac{\partial^2 f}{\partial x \partial y} (\mathbf{a}), C = \frac{\partial^2 f}{\partial y^2} (\mathbf{a})
$$
则：

$AC – B^2 > 0, A > 0$，则 $f(\mathbf{a})$ 为严格极小值；
$AC – B^2 > 0, A < 0$，则 $f(\mathbf{a})$ 为严格极大值。
$AC – B^2 < 0$，则 $f(\mathbf{a})$ 不是极值。

证明略。

注：关于 Hesse 矩阵的性质，还有半定的情况，此时定理失效。

反例如 $f_1(x, y) = x^4 – y^4, f_2(x, y) = x^4 + y^4$。

微积分笔记

351 次浏览

No Comments

Add your comment 取消回复

要发表评论，您必须先登录。

微积分笔记（41）——多变量函数的微分学（4）

微积分笔记（41）——多变量函数的微分学（4）

多变量函数的微分学

多元函数的多项式逼近

回忆

多项式逼近问题

方法（将 $n$ 元函数化为 $1$ 元函数情况）

Taylor 公式（$C^2$ 函数的多项式逼近）

多元函数的极值问题

极值问题

极值（局部最值）

极值必要条件

驻点-临界点

极值的充分条件

$2$ 元函数的极值判别

No Comments

Add your comment 取消回复

登录

热门文章

近期评论

扫描二维码加入交流

微积分笔记（41）——多变量函数的微分学（4）

微积分笔记（41）——多变量函数的微分学（4）

多变量函数的微分学

多元函数的多项式逼近

回忆

多项式逼近问题

方法（将 $n$ 元函数化为 $1$ 元函数情况）

Taylor 公式（$C^2$ 函数的多项式逼近）

多元函数的极值问题

极值问题

极值（局部最值）

极值必要条件

驻点-临界点

极值的充分条件

$2$ 元函数的极值判别

No Comments

Add your comment 取消回复

登录

热门文章

近期评论

标签

扫描二维码加入交流