![Python机器学习算法与应用](https://wfqqreader-1252317822.image.myqcloud.com/cover/455/34752455/b_34752455.jpg)
上QQ阅读APP看书,第一时间看更新
2.4.2 主成分分析的几何解释
假设有n个样品,每个样品有两个变量,即在二维空间中讨论主成分的几何意义。设n个样品在二维空间中的分布大致为一个椭圆,如图2.2所示。
![](https://epubservercos.yuewen.com/E04642/18562448708360306/epubprivate/OEBPS/Images/ZQ-185-009_0101.jpg?sign=1739305947-l4Cj44jKFLMhS6bsQdCY1SKs838XW9ZY-0-7502c93c2929dd032b4aee5bceabffc5)
图2.2 主成分几何解释图
将图2.2中的坐标系进行正交旋转一个角度θ,使其椭圆长轴方向取坐标y1,在椭圆短轴方向取坐标y2,旋转公式为
![](https://epubservercos.yuewen.com/E04642/18562448708360306/epubprivate/OEBPS/Images/ZQ-185-009_inline_0102.jpg?sign=1739305947-SHj3DaJkREiEoaJX0NmG7oNXfU31bMoO-0-e68d1d4daf0eafa19888008bd4063c54)
(2.47)
写成矩阵形式为:
![](https://epubservercos.yuewen.com/E04642/18562448708360306/epubprivate/OEBPS/Images/ZQ-185-009_inline_0104.jpg?sign=1739305947-VJH0qX5bgSeGwx3zd8sUwTnD6Q7y9e0X-0-df33cb51aeed1d99f50a091d354963eb)
(2.48)
其中U为坐标旋转变换矩阵,是正交矩阵,即有U'=U-1,UU'=I,即满足。
经过旋转变换后,得到图2.3所示的新坐标系。
![](https://epubservercos.yuewen.com/E04642/18562448708360306/epubprivate/OEBPS/Images/ZQ-185-009_0107.jpg?sign=1739305947-4RGiGccZi9kpHinE13yf0UZd3wn7RUIP-0-c0d32a25fba9c2fb5b41e665336db981)
图2.3 经过旋转变换后得到的新坐标系
新坐标系中的y1、y2有如下性质:
(1)n个点的坐标y1和y2的相关几乎为零。
(2)二维平面上n个点的方差大部分都归结到y1轴上,而y2轴上的方差较小。
y1和y2称为原始变量x1和x2的综合变量。由于n个点在y1轴上的方差最大,因而将二维空间的点用y1轴上的一维综合变量来代替,所损失的信息量最小,由此称y1轴为第一主成分。y2轴与y1轴正交,有较小的方差,称为第二主成分。