为什么要降维?(PCA) 节省存储空间 加速计算速度。维度越少计算量也越少。 取出冗杂特征,去掉相关性太强的两个特征,避免一种特征权重太大。 便于观察数据信息,比如四维降到二维、三维。 特征太多容易引起过拟合。 信息丢失少,同时可以降低维度。 PCA降维 最近重构性:所有样本点到这个超平面的距离足够近。 最大可分性:所有样本点投影到超平面后,投影尽可能分开。 实际上满足一个也会同时满足另一个。 理论展示1 2 3 4