Skip to content

第十四讲:正交向量与子空间

在四个基本子空间中,提到对于秩为r的m×n矩阵,其行空间(dimC(AT)=r)与零空间(dimN(A)=nr)同属于Rn空间,其列空间(dimC(A)=r)与左零空间(dimN(AT)=m-r)同属于Rm空间。

对于向量x,y,当xTy=0x1y1+x2yx++xnyn=0时,有向量x,y正交(vector orthogonal)。

毕达哥拉斯定理(Pythagorean theorem)中提到,直角三角形的三条边满足:

x2+y2=x+y2xTx+yTy=(x+y)T(x+y)xTx+yTy=xTx+yTy+xTy+yTx0=xTy+yTxxTy=yTx0=2xTyxTy=0

由此得出,两正交向量的点积为0。另外,x,y可以为0向量,由于0向量与任意向量的点积均为零,所以0向量与任意向量正交。

举个例子: x=[123],y=[210],x+y=[313],有x2=14,y2=5,x+y2=19,而xTy=1×2+2×(1)+3×0=0

向量S与向量T正交,则意味着S中的每一个向量都与T中的每一个向量正交。若两个子空间正交,则它们一定不会相交于某个非零向量。

现在观察行空间与零空间,零空间是Ax=0的解,即x若在零空间,则Ax为零向量;

而对于行空间,有 [row1row2rowm][x]=[000],可以看出:

[row1][x]=0[row2][x]=0[rowm][x]=0

所以这个等式告诉我们,xA中的所有行正交;

接下来还验证x是否与A中各行的线性组合正交, {c1(row1)Tx=0c2(row2)Tx=0cn(rowm)Tx=0,各式相加得(c1row1+c2row2++cnrowm)Tx=0,得证。

我们可以说,行空间与零空间将Rn分割为两个正交的子空间,同样的,列空间与左零空间将Rm分割为两个正交的子空间。

举例,A=[1252410],则可知m=2,n=3,rank(A)=1,dimN(A)=2

Ax=[1252410][x1x2x3]=[00],解得零空间的一组基x1=[210]x2=[501]

而行空间的一组基为r=[125],零空间与行空间正交,在本例中行空间也是零空间的法向量。

补充一点,我们把行空间与零空间称为n维空间里的正交补(orthogonal complement),即零空间包含了所有与行空间正交的向量;同理列空间与左零空间为m维空间里的正交补,即左零空间包含了所有与零空间正交的向量。

接下来看长方矩阵,m>n。对于这种矩阵,Ax=b中经常混入一些包含“坏数据”的方程,虽然可以通过筛选的方法去掉一些我们不希望看到的方程,但是这并不是一个稳妥的方法。

于是,我们引入一个重要的矩阵:ATA。这是一个n×m矩阵点乘m×n矩阵,其结果是一个n×n矩阵,应该注意的是,这也是一个对称矩阵,证明如下:

(ATA)T=AT(AT)T=ATA

这一章节的核心就是ATAx=ATb,这个变换可以将“坏方程组”变为“好方程组”。

举例,有[111215][x1x2]=[b1b2b3],只有当[b1b2b3]在矩阵的列空间时,方程才有解。

现在来看[111125][111215]=[38830],可以看出此例中ATA是可逆的。然而并非所有ATA都是可逆的,如[111333][131313]=[39927](注意到这是两个秩一矩阵相乘,其结果秩不会大于一)

先给出结论:

N(ATA)=N(A)rank(ATA)=rank(A)ATAN(A)A线

下一讲涉及投影,很重要。

本站没有备案,因为不需要备案