为什么要降维?(PCA)

  1. 节省存储空间
  2. 加速计算速度。维度越少计算量也越少。
  3. 取出冗杂特征,去掉相关性太强的两个特征,避免一种特征权重太大。
  4. 便于观察数据信息,比如四维降到二维、三维。
  5. 特征太多容易引起过拟合。
  6. 信息丢失少,同时可以降低维度。

PCA降维

  1. 最近重构性:所有样本点到这个超平面的距离足够近。
  2. 最大可分性:所有样本点投影到超平面后,投影尽可能分开。
  3. 实际上满足一个也会同时满足另一个。

理论展示

<center>1
1
<center>2
2
<center>3
3
<center>4
4