1.特征选择
特征选择是降维的一种方法,即选择对预测结果相关度高的特征或者消除相似度高的特征,以提高估计函数的准确率或者提高多维度数据集上的性能。
2.删除低方差特征
1)思路:设置一个阀值,对每个特征求方差,如果所求方差低于这个阀值,则删除此特征。默认情况下会删除0方差。
2)核心函数
sklearn.feature_selection.VarianceThreshold
3)主要参数:
threshold :设置的阀值