f_classif#
- sklearn.feature_selection.f_classif(X, y)[source]#
计算提供的样本的ANOVA F值。
更多信息请阅读用户指南。
- 参数:
- X{array-like, sparse matrix} of shape (n_samples, n_features)
将按顺序测试的回归量集合。
- y形状为 (n_samples,) 的类数组
目标向量。
- 返回:
- f_statistic形状为 (n_features,) 的ndarray
每个特征的 F 统计量。
- p_values形状为 (n_features,) 的ndarray
与 F 统计量相关的 P 值。
参见
chi2
用于分类任务的非负特征的卡方统计量。
f_regression
回归任务中标签/特征之间的 F 值。
示例
>>> from sklearn.datasets import make_classification >>> from sklearn.feature_selection import f_classif >>> X, y = make_classification( ... n_samples=100, n_features=10, n_informative=2, n_clusters_per_class=1, ... shuffle=False, random_state=42 ... ) >>> f_statistic, p_values = f_classif(X, y) >>> f_statistic array([2.2...e+02, 7.0...e-01, 1.6...e+00, 9.3...e-01, 5.4...e+00, 3.2...e-01, 4.7...e-02, 5.7...e-01, 7.5...e-01, 8.9...e-02]) >>> p_values array([7.1...e-27, 4.0...e-01, 1.9...e-01, 3.3...e-01, 2.2...e-02, 5.7...e-01, 8.2...e-01, 4.5...e-01, 3.8...e-01, 7.6...e-01])