1.特征选择

         特征选择是降维的一种方法,即选择对预测结果相关度高的特征或者消除相似度高的特征,以提高估计函数的准确率或者提高多维度数据集上的性能。

 

2.删除低方差特征

        1)思路:设置一个阀值,对每个特征求方差,如果所求方差低于这个阀值,则删除此特征。默认情况下会删除0方差。

        2)核心函数

              sklearn.feature_selection.VarianceThreshold

       3)主要参数:

              threshold :设置的阀值

网友评论