我们讨论一般函数 f:A⊂Rn→Rm 的泰勒公式,为此我们首先讨论高阶导数。对于 f:Rn→R ,定义高阶偏导没有问题;我们仅仅迭代偏导的过程
∂2f∂x1∂x2=∂∂x1(∂∂x2f)
然而,将导数看做线性映射时需要非常小心。
如果二阶导存在的话,可以通过对 Df 求导获得,过程如下。
定义4 令 L(Rn,Rm) 表示从 Rn 到 Rm 的线性映射空间,(如果我们在 Rn , Rm 中选择一个基,那么 L(Rn,Rm) 等同于 m×n 矩阵)接下里 Df:A→L(Rn,Rm) ;即对每个 x∈A 我们得到一个线性映射 Df(x0) 。如果我们在 x0 处对 Df 求导,我们就得到从 Rn 到 L(Rn,Rm) 的线性映射,写作 D(Df(x0))=D2f(x0) 。我们将 Bx0:Rn×Rn→Rm 定义成 Bx0(x1,x2)=[D2f(x0)(x1)](x2)
因为 D2f(x0):Rn→L(Rn,Rm) ,上面的定义讲得通,所以 D2f(x0)(x1)∈L(Rn,Rm) ;因此它能够用到 x2 上。我们这么做的原因是 Bx0 避免不必要的使用较难的空间 L(Rn,Rm)≈Rnm 。
根据定义,双线性(bilinear)映射 B:E×F→G ,其中 E,F,G 是向量空间,就是每个变量都是线性的映射;例如对第一个变量,也就是说 B(αe1+βe2,f)=αB(e1,f)+βB(e2,f) ,其中 e1,e2∈E,f∈F,α,β∈R ,上面定义的映射 Bx0 很容易看成 Rn×Rn→Rm 的一个双线性映射。
接下来,对于双线性映射 B:E×F→R ,我们可以将每个 E 的基e1,…,en和 F 的f1,…,fm与一个矩阵关联起来,即令
aij=B(ei,fj)
那么如果
x=∑i=1nxieiy=∑j=1myjfj
我们有
B(x,y)=∑ijaijxiyj=(x1,x2,…,xn)⎛⎝⎜⎜⎜⎜⎜⎜a11⋅⋅⋅an1⋯a1m⋅⋅⋅anm⎞⎠⎟⎟⎟⎟⎟⎟⎛⎝⎜⎜⎜⎜⎜⎜y1⋅⋅⋅ym⎞⎠⎟⎟⎟⎟⎟⎟
注意:对于二阶导数,双线性映射 Bx0 在 x0 处对 Df 的求导依然写成 D2(f) 。
定理8 令 f:A⊂Rn→R 在开集 A 上二阶可导,那么D2f(x):Rn×Rn→R对于标准基的矩阵为
⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜∂2f∂x1∂x1⋅⋅⋅∂2f∂xn∂x1⋯⋯∂2f∂x1∂xn⋅⋅⋅∂2f∂xn∂xn⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟
其中每个偏微分都是在点 x=(x1,…,xn) 处进行计算。
对于高阶微分,使用相似的处理过程。例如 D3f 对每个 x 给出一个三线性映射D3(f):Rn×Rn×Rn→Rm,我们没有将这个映射与矩阵联系起来,而是用三个标记的量来表示;对于每个元素 fk 来说就是 ∂3fk(∂xl∂xj∂xi) (这样的量叫张量(tensor))。
在处理泰勒定义之前,我们首先给出二阶导数一个非常重要的性质:定理8中的矩阵是对称的,即
∂2f∂xi∂xj=∂2f∂xj∂xi
定理9 令 f:A→R 在开集 A 上二阶可导且D2f连续(即函数 ∂2f/(∂xi∂j) 是连续的),那么 D2f 是对称的;即
D2f(x)(x1,x2)=D2f(x)(x2,x1)
或者用元素的方式表示就是
∂2f∂xi∂xj=∂2f∂xj∂xi
从上面的定理可以看出,在相似的条件下,高阶微分也是对称的,对于 f:A→Rm 来说,我们可以将上面的定理应用到 f 的元素上得出微分。
二阶微分的对称性是基本性质,但在单标量微积分中不存在这种情况,现在我们通过实例来验证这些原则。
假设f(x,y,z)=exysinx+x2y4cos2z,所以 f:R3→R ,那么
∂f∂x∂f∂y=exycosx+yexysinx+2xy4cos2z=xexysinx+4x2y3cos2z
并且
∂f∂y∂x=xexycosx+exysinx+xyexysinx+8xy3cos2z
这与 ∂2f/∂x∂y 是一样的。
定理9直观上不太明显,然而可以从证明中得出一些直观信息。
定义5 如果一个函数的前 r 阶导数存在且连续,那么我们称该函数是Cr类(class)。(等价的,这意味着到 r 阶之间的所有导数均存在且连续)如果函数对于所有正整数r都是 Cr 类,那么我们称该函数是光滑的(smooth)或是 C∞ 类。
利用定理5(坐标形式是最简单的)中的公式,我们可以说明 Cr 的复合函数还是 Cr 。
泰勒定理如下所述:
定理10 对开集 A⊂Rn ,令 f:A→R 是 Cr 类,令 x,y∈A 并且假设连接 x,y 的线段位于 A 中,那么在这条线段上存在点c使得
f(y)−f(x)=∑k=1r−11k!Dkf(x)(y−x,…,y−x)+1r!Dr(c)(y−x,…,y−x)
其中 Dkf(x)(y−x,…,y−x) 表示 k 线性映射Dkf(x)作用到 k 元(y−x,…,y−x)上,在坐标中
Dkf(x)(y−x,…,y−x)=∑i1,…,ik=1n(∂kf∂xi1⋯∂xik)(yi1−xxi)⋯(yik−xik)
令 y=x+h ,我们可以将泰勒公式重新写成
f(x+h)=f(x)+Df(x)⋅h+⋯+1(r−1)!Dr−1f(x)⋅(h,…,h)+Rr−1(x,h)
其中 Rr−1(x,h) 是余项(remainder),进一步
当h→0时Rr−1(x,h)∥h∥r−1→0
余项还有其他的表示形式,我们会在证明中给出来,这个定理是均值定理( r=1 的情况)的推广,也是单元微积分中泰勒定理的推广。
根据泰勒定理,我们可以写出 x0 的泰勒级数(Taylor series)
∑k=0∞1k!Dkf(x0)(x−x0,…,x−x0)
即便 f 是C∞,它也没必要收敛,如果它在 x0 的邻域内收敛,那么我们说 f 在x0处是可解析的。为了说明 f 是可解析的,我们需要展示在r→∞时,余项 (1/r!)Drf(c)(x−x0,…,x−x0)→0 ,那么它就能用来建立常见的幂级数表达式,像 sinx,cosx 等等。
例1: 对函数 f(x,y)=yx2(cosy2) ,验证定理9。
解:
∂f∂x=2xycosy2,∂2f∂y∂x=2xcosy2−4xy2siny2
∂f∂y=x2cosy2−2y2x2siny2,∂2f∂x∂y=2xcosy2−4y2xsiny2
例2: 如果 f 是R上的 C∞ 且对于每个区间 [a,b] ,存在常数 M 使得对每个n,x∈[a,b],不等式 |fn(x)|≤M 成立,说明 f 在每个x0处可解析并且
f(x)=∑n=0∞f(n)(x0)n!(x−x0)n
解: 余项是
∣∣∣∑n=0∞f(n)(x0)n!(x−x0)n∣∣∣≤Mn|x−x0|nn!
当 n→∞ 时余项 →0 ,因为利用比率测试,对应的级数收敛。通过观察可知这个收敛在所有有界区间上是一致收敛的。
例3: 给出一个是 C∞ 函数但是不可解析。
解: 令
f(x)={0,e−1/x,x≤0x>0
f 平滑性唯一有问题的地方就是x=0处,但是对于 x>0
f′(x)=1x2e−1/x
当 x→0+ 时导数 →0 (利用洛必达法则),同样的我们可以看出 x→0+ 时 f(n)(x)→0 ,从而利用均值定理我们可以看出 f 在0处是C∞且 f(n)(0)=0 ,因此 x=0 处的泰勒级数等于零,所以 f 不等于x=0处泰勒级数,故 f 不是可解析的。
例4:计算 f(x,y)=sin(x+2y) 在 (0,0) 周围的二阶泰勒公式。
解: 这里 f(0,0)=0 ,
∂f∂x(0,0)∂f∂y(0,0)∂2f∂x2(0,0)∂2f∂y2(0,0)∂2f∂x∂y(0,0)=cos(0+2⋅0)=1,=2cos(0+2⋅0)=2,=0,=0,=0
从而
f(h,k)=h+2k+R2(h,k),(0,0)
其中
当(h,k)→(0,0)时,R2(h,k),(0,0)/|(h,k)|2→0