Loading [MathJax]/jax/output/HTML-CSS/jax.js

微积分笔记(41)——多变量函数的微分学(4)

微积分笔记(41)——多变量函数的微分学(4)

多变量函数的微分学

多元函数的多项式逼近

回忆

用一元多项式逼近一元函数,也就是利用 Taylor 公式。

现在希望用 n 元多项式逼近 n 元函数。

多项式逼近问题

  1. n 元函数 f(x) 可微,则:
    f(a+Δx)=f(a)+ni=1Dif(a)Δxi+o(Δx)

  2. 若上面 f(x)a 点有 m+1 阶连续偏导数,是否有 m 次多项式 Pm(x),使得:
    f(a+Δx)=Pm(Δx)+o(Δxm)


    若答案肯定,如何求 Pm(x)

方法(将 n 元函数化为 1 元函数情况)

fCm+1(Br(a)),aRn,r>0,ΔxRn,Δx<r,定义: φ(t)=f(a+tΔx)Cm+1[0,1]

应用一元函数的 Taylor 公式:t[0,1],θ[0,1]φ(t)=mk=1φ(k)(0)k!tk+φ(m+1)(θt)(m+1)!tm+1
特别取 t=1 得到: φ(1)=mk=1φ(k)(0)k!+φ(m+1)(θ)(m+1)!
下面将引入的 1 元函数回到 n 元函数 f 的表达式。已知 φ(t)=f(a+tΔx)Cm+1[0,1],θ(0,1) 有上面结论成立。其中: φ(1)=f(a+Δx),φ(0)=f(a)
并且: φ(t)=ni=1f(a+tΔx)xiΔxi,φ(0)=ni=1f(a)xiΔxiφ(t)=ni,j=12f(a+tΔx)xixjΔxiΔxj,
带回 (1) 即可得 Taylor 公式。

Taylor 公式(C2 函数的多项式逼近)

fC2(Br(a)),aRn,r>0,则 Δx<r,θ(0,1)f(a+Δx)=f(a)+ni=1f(a)xiΔxi+12ni,j=12f(a+θΔx)xixjΔxiΔxj

为简化表达式,引入 Hesse 矩阵: Hf(x):=(D1D1f(x)D1Dnf(x)DnD1f(x)DnDnf(x))n×n
综上可以得到以下 2 种 Taylor 多项式逼近公式: f(a+Δx)=f(a)+Jf(a)Δx+12(Δx)THf(a)Δx+o(Δx2)
f(a+Δx)=f(a)+Jf(a)Δx+12(Δx)THf(a+θΔx)Δx
其中 (2) 为带 Peano 型余项,(3) 为带 Lagrange 型余项,其中 θ(0,1)。上面公式采用了矩阵记号与运算约定。证明:只须注意 (Δx)T[Hf(a+θΔx)Hf(a)]Δx=o(Δx2)

多元函数的极值问题

极值问题

求函数的极大极小值,最大最小值,是 Taylor 公式的一个应用。

极值(局部最值)

f:DR,aD

  1. f(a) 是极大值:r>0,xa<r,f(x)f(a)
  2. f(a) 是极小值:r>0,xa<r,f(x)f(a)

(严格极值定义略)

f(a) 是极大值或极小值,则称 a 为极大值点或极小值点。

极值必要条件

  1. fa 点达到极值且 Duf 存在,则 Du(a)=0
  2. fa 点达到极值且可微,则 Jf(a)=0,也即 Dif(a)=0,i=1,2,,n

驻点-临界点

若函数 Jf(a)=0,则称 af 的驻点(也称临界点)。

  1. 在有些文献中,不可微点也被称为临界点。
  2. 可微函数仅在驻点达到极值,但反之不比成立。

对于 f(x,y)=x2y2,原点是驻点,但是原点并非极值点。

极值的充分条件

如果 af(x) 的驻点,则根据 Taylor 公式,可知 a 是否极值点由 Hesse 矩阵 Hf 的性质决定。

如果 r>0,fC2(Br(a)),则:

  1. Hf 正定,则 f(a) 为严格极小值。
  2. Hf 负定,则 f(a) 为严格极大值。
  3. Hf 不定,则 f(a) 不是极值。

证明:如前观察,已知 Hf(a) 正定,其特征值全部大于 0,由连续性可知 x=a 附近 Hf(x) 也正定,由此导出第一条。

第二条与第一条完全平行。

对于第三条,论证基于:
f(a+Δx)=f(a)+12(Δx)THf(a)Δx+o(Δx2)


已知矩阵 Hf(a) 不定:u,vRn,u=v=1
uTHf(a)u>0>vTHf(a)v

特别有:
f(a+tu)=f(a)+t22(uTHf(a)u)+o(t2)f(a+tv)=f(a)+t22(vTHf(a)v)+o(t2)

因此当 t 充分小时:
f(a+tu)>f(a)>f(a+tv)

f(a) 不是极值。

2 元函数的极值判别

af(x,y) 的驻点且 r>0,fC2(Br(a)),记:
A=2fx2(a),B=2fxy(a),C=2fy2(a)


则:

  1. ACB2>0,A>0,则 f(a) 为严格极小值;
  2. ACB2>0,A<0,则 f(a) 为严格极大值。
  3. ACB2<0,则 f(a) 不是极值。

证明略。

:关于 Hesse 矩阵的性质,还有半定的情况,此时定理失效。

反例如 f1(x,y)=x4y4,f2(x,y)=x4+y4

 

点赞 0

No Comments

Add your comment

在人间有谁活着不像是一场炼狱,我不哭我已经没有尊严能放弃。