sklearn.feature_selection#

特征选择算法。

这些包括单变量过滤选择方法和递归特征消除算法。

用户指南。 详见特征选择章节。

GenericUnivariateSelect

具有可配置策略的单变量特征选择器。

RFE

使用递归特征消除进行特征排序。

RFECV

使用交叉验证的递归特征消除进行特征选择。

SelectFdr

过滤器:根据估计的错误发现率选择p值。

SelectFpr

过滤器:根据FPR测试选择低于alpha的p值。

SelectFromModel

用于根据重要性权重选择特征的元转换器。

SelectFwe

过滤器:选择对应于家族错误率的p值。

SelectKBest

根据k个最高分数选择特征。

SelectPercentile

根据最高分数的百分位数选择特征。

SelectorMixin

给定支持掩码执行特征选择的转换器mixin。

SequentialFeatureSelector

执行序列特征选择的转换器。

VarianceThreshold

移除所有低方差特征的特征选择器。

chi2

计算每个非负特征和类别之间的卡方统计量。

f_classif

计算给定样本的ANOVA F值。

f_regression

返回F统计量和p值的单变量线性回归测试。

mutual_info_classif

估计离散目标变量的互信息。

mutual_info_regression

估计连续目标变量的互信息。

r_regression

计算每个特征与目标变量的皮尔逊r值。