版本 1.8#

更新日志图例

重大功能以前无法实现的大功能。
功能以前无法实现的功能。
效率提升现有功能现在可能不需要那么多计算或内存。
增强一般性的小改进。
修复以前无法按文档或合理预期工作的问题现在应该可以了。
API 变更未来你需要更改代码才能达到相同的效果；或者未来某个功能将被移除。

版本 1.8.0#

2025年12月

影响多个模块的变更#

效率提高了依赖加权百分位数估计器和度量函数的 CPU 和内存使用率，并更好地匹配 NumPy 和 Scipy（未加权）的百分位数实现。作者：Lucy Liu #31775

支持 Array API#

已更新其他估计器和函数以包含对所有 Array API 兼容输入的支持。

有关详细信息，请参阅 Array API 支持（实验性）。

特性 sklearn.preprocessing.StandardScaler 现在支持 Array API 兼容的输入。作者：Alexander Fabisch、Edoardo Abati、Olivier Grisel 和 Charles Hill。 #27113
特性 linear_model.RidgeCV、linear_model.RidgeClassifier 和 linear_model.RidgeClassifierCV 现在使用 solver="svd" 支持 Array API 兼容的输入。作者：Jérôme Dockès。 #27961
特性针对除“laplacian”之外的任何核的 metrics.pairwise.pairwise_kernels 和针对“cosine”、“euclidean”和“l2”度量的 metrics.pairwise_distances 现在支持 Array API 输入。作者：Emily Chen 和 Lucy Liu #29822
特性 sklearn.metrics.confusion_matrix 现在支持 Array API 兼容的输入。作者：Stefanie Senger #30562
特性 sklearn.mixture.GaussianMixture 使用 init_params="random" 或 init_params="random_from_data" 和 warm_start=False 现在支持 Array API 兼容的输入。作者：Stefanie Senger 和 Loïc Estève #30777
特性 sklearn.metrics.roc_curve 现在支持 Array API 兼容的输入。作者：Thomas Li #30878
特性 preprocessing.PolynomialFeatures 现在支持 Array API 兼容的输入。作者：Omar Salman #31580
特性 calibration.CalibratedClassifierCV 现在支持 method="temperature" 和底层 estimator 也支持 Array API 的情况下的 Array API 兼容输入。作者：Omar Salman #32246
特性 sklearn.metrics.precision_recall_curve 现在支持 Array API 兼容的输入。作者：Lucy Liu #32249
特性 sklearn.model_selection.cross_val_predict 现在支持 Array API 兼容的输入。作者：Omar Salman #32270
特性 sklearn.metrics.brier_score_loss、sklearn.metrics.log_loss、sklearn.metrics.d2_brier_score 和 sklearn.metrics.d2_log_loss_score 现在支持 Array API 兼容的输入。作者：Omar Salman #32422
特性 naive_bayes.GaussianNB 现在支持 Array API 兼容的输入。作者：Omar Salman #32497
特性 preprocessing.LabelBinarizer 和 preprocessing.label_binarize 现在支持 sparse_output=False 的数值 Array API 兼容输入。作者：Virgil Chan。 #32582
特性 sklearn.metrics.det_curve 现在支持 Array API 兼容的输入。作者：Josef Affourtit。 #32586
特性 sklearn.metrics.pairwise.manhattan_distances 现在支持 Array API 兼容的输入。作者：Omar Salman。 #32597
特性 sklearn.metrics.calinski_harabasz_score 现在支持 Array API 兼容的输入。作者：Josef Affourtit。 #32600
特性 sklearn.metrics.balanced_accuracy_score 现在支持 Array API 兼容的输入。作者：Omar Salman。 #32604
特性 sklearn.metrics.pairwise.laplacian_kernel 现在支持 Array API 兼容的输入。作者：Zubair Shakoor。 #32613
特性 sklearn.metrics.cohen_kappa_score 现在支持 Array API 兼容的输入。作者：Omar Salman。 #32619
特性 sklearn.metrics.cluster.davies_bouldin_score 现在支持 Array API 兼容的输入。作者：Josef Affourtit。 #32693
修复支持 Array API 的估计器在启用 Array API 支持时，不再拒绝 DataFrame 输入。作者：Tim Head #32838

元数据路由#

有关更多详细信息，请参阅元数据路由用户指南。

修复修复了当启用元数据路由时，将 sample_weight 传递给 GridSearchCV 中的 Pipeline 会引发错误的问题。作者：Adrin Jalali。 #31898

支持 Free-threaded CPython 3.14#

scikit-learn 支持 free-threaded CPython，特别是我们的所有支持的平台在 Python 3.14 上都提供了 free-threaded wheel。

Free-threaded（也称为 nogil）CPython 是 CPython 的一个版本，它通过移除全局解释器锁 (GIL) 来实现高效的多线程用例。

如果您想尝试 free-threaded Python，建议使用 Python 3.14，它与 Python 3.13 相比修复了许多问题。请随时在您的用例中尝试 free-threaded 并报告任何问题！

有关 free-threaded CPython 的更多详细信息，请参阅 py-free-threading doc，特别是如何安装 free-threaded CPython 和生态系统兼容性跟踪。

作者：Loïc Estève 和 Olivier Grisel 以及更广泛的 Scientific Python 和 CPython 生态系统中的许多其他人，例如 Nathan Goldbaum、Ralf Gommers、Edgar Andrés Margffoy Tuay。 #32079

`sklearn.base`#

特性重构了 BaseEstimator 中的 dir，使其能够识别 available_if 中的条件检查。作者：John Hendricks 和 Miguel Parece。 #31928
修复修复了所有估计器的 HTML 显示中 pandas 缺失值的处理问题。作者：Dea María Léon。 #32341

`sklearn.calibration`#

特性在 calibration.CalibratedClassifierCV 中添加了温度缩放方法。作者：Virgil Chan 和 Christian Lorentzen。 #31068

`sklearn.cluster`#

效率 cluster.kmeans_plusplus 现在直接使用 np.cumsum，无需额外的数值稳定性检查，也无需转换为 np.float64。作者：Tiziano Zito #31991
修复 cluster.HDBSCAN 中 copy 参数的默认值将从 False 更改为 True（在 1.10 版本中），以避免数据修改并与其他估计器保持一致。作者：Sarthak Puri。 #31973

`sklearn.compose`#

修复当任何转换器具有稀疏输出时，compose.ColumnTransformer 现在可以正确地在 polars.DataFrame 提供的 Pandas DataFrame 数据上进行拟合。作者：Phillipp Gnan。 #32188

`sklearn.covariance`#

效率 sklearn.covariance.GraphicalLasso、sklearn.covariance.GraphicalLassoCV 和 sklearn.covariance.graphical_lasso 使用 mode="cd" 时，得益于 sklearn.linear_model.Lasso 通过间隙安全筛选规则实现的拟合时间性能提升。作者：Christian Lorentzen。 #31987
修复修复了 sklearn.covariance.GraphicalLasso、sklearn.covariance.GraphicalLassoCV 和 sklearn.covariance.graphical_lasso 中无法控制的随机性。对于 mode="cd"，它们现在使用循环坐标下降。以前，它使用的是随机坐标下降，随机数种子无法控制。作者：Christian Lorentzen。 #31987
修复对 covariance.MinCovDet 进行了修正，以适应正态分布的一致性。这减少了将此方法应用于正态分布数据时存在的偏差。作者：Daniel Herrera-Esposito #32117

`sklearn.decomposition`#

效率使用 fit_algorithm="cd" 的 sklearn.decomposition.DictionaryLearning 和 sklearn.decomposition.MiniBatchDictionaryLearning，使用 transform_algorithm="lasso_cd" 的 sklearn.decomposition.SparseCoder，sklearn.decomposition.MiniBatchSparsePCA，sklearn.decomposition.SparsePCA，method="cd" 的 sklearn.decomposition.dict_learning 和 sklearn.decomposition.dict_learning_online，以及 algorithm="lasso_cd" 的 sklearn.decomposition.sparse_encode，都得益于 sklearn.linear_model.Lasso 通过间隙安全筛选规则实现的拟合时间性能提升。作者：Christian Lorentzen。 #31987
增强 decomposition.SparseCoder 现在遵循 scikit-learn 的 Transformer API。此外，fit 方法现在会验证输入和参数。作者：François Paugam。 #32077
修复为 decomposition.PCA 和 decomposition.IncrementalPCA 的 inverse_transform 方法添加了输入检查。 Ian Faust 的 #29310。

`sklearn.discriminant_analysis`#

特性在 discriminant_analysis.QuadraticDiscriminantAnalysis 中添加了 solver、covariance_estimator 和 shrinkage 参数。由此产生的类更类似于 discriminant_analysis.LinearDiscriminantAnalysis，并允许在协方差矩阵的估计方面有更大的灵活性。作者：Daniel Herrera-Esposito。 #32108

`sklearn.ensemble`#

修复 ensemble.BaggingClassifier、ensemble.BaggingRegressor 和 ensemble.IsolationForest 现在使用 sample_weight 来绘制样本，而不是将它们乘以统一抽样的掩码并传递给底层估计器。此外，当 max_samples 是浮点数时，它现在被解释为 sample_weight.sum() 的分数，而不是 X.shape[0]。新的默认值 max_samples=None 会抽取 X.shape[0] 个样本，而忽略 sample_weight。作者：Antoine Baker。 #31414 和 #32825

`sklearn.feature_selection`#

增强 feature_selection.SelectFromModel 现在不强制 max_features 小于或等于输入特征的数量。作者：Thibault #31939

`sklearn.gaussian_process`#

效率当 return_cov 和 return_std 都为 False 时，使 GaussianProcessRegressor.predict 变得更快。作者：Rafael Ayllón Gavilán。 #31431

`sklearn.linear_model`#

效率使用 precompute=False 的 linear_model.ElasticNet 和 linear_model.Lasso 对于密集的 X 使用更少的内存，并且速度略快。以前，即使对于 Fortran 连续的 X，它们也使用了 X 两倍的内存。作者：Christian Lorentzen #31665
效率 linear_model.ElasticNet 和 linear_model.Lasso 避免了重复的输入检查，因此速度略快。作者：Christian Lorentzen。 #31848
效率 linear_model.ElasticNet、linear_model.ElasticNetCV、linear_model.Lasso、linear_model.LassoCV、linear_model.MultiTaskElasticNet、linear_model.MultiTaskElasticNetCV、linear_model.MultiTaskLasso 和 linear_model.MultiTaskLassoCV 通过避免在最内层循环中进行 BLAS 1 级（axpy）调用，从而加快了拟合速度。函数 linear_model.enet_path 和 linear_model.lasso_path 同样如此。作者：Christian Lorentzen #31956 和 #31880
效率 linear_model.ElasticNetCV、linear_model.LassoCV、linear_model.MultiTaskElasticNetCV 和 linear_model.MultiTaskLassoCV 避免了 copy_X=True 默认值下的 X 的额外复制。作者：Christian Lorentzen。 #31946
效率 linear_model.ElasticNet、linear_model.ElasticNetCV、linear_model.Lasso、linear_model.LassoCV、linear_model.MultiTaskElasticNet、linear_model.MultiTaskElasticNetCV linear_model.MultiTaskLasso、linear_model.MultiTaskLassoCV 以及 linear_model.lasso_path 和 linear_model.enet_path 现在为密集型和稀疏型 X 的坐标下降求解器实现了间隙安全筛选规则。拟合时间的加速尤其显著（可能高达 10 倍），尤其是在计算正则化路径时，例如上述估计器的 *CV-variants。现在，在进入下降步骤的主循环之前，会增加一个停止标准的检查。由于停止标准需要计算对偶间隙，因此每当计算对偶间隙时就会发生筛选。作者：Christian Lorentzen #31882、#31986、#31987 和 #32014
增强 linear_model.ElasticNet、linear_model.ElasticNetCV、linear_model.Lasso、linear_model.LassoCV、MultiTaskElasticNet、MultiTaskElasticNetCV、MultiTaskLasso、MultiTaskLassoCV，以及 linear_model.enet_path 和 linear_model.lasso_path 现在使用 dual gap <= tol 而不是 dual gap < tol 作为停止标准。在某些罕见情况下，由此产生的系数可能与 scikit-learn 的先前版本不同。作者：Christian Lorentzen。 #31906
修复修复了 SGD 模型的收敛标准，以避免在 tol != None 时过早收敛。这主要影响 SGDOneClassSVM，但也会影响 SGDClassifier 和 SGDRegressor。在此修复之前，只有不带惩罚项的损失函数被用作收敛检查，而现在，则使用带正则化的完整目标函数。作者：Guillaume Lemaitre 和 kostayScr #31856
修复 linear_model.SGDClassifier、linear_model.SGDOneClassSVM、linear_model.SGDRegressor 和 linear_model.Perceptron 中初始学习率 eta0 的允许参数范围从非负数更改为严格正数。因此，linear_model.SGDClassifier 和 linear_model.SGDOneClassSVM 的默认 eta0 从 0 更改为 0.01。但请注意，eta0 不会被这两个估计器的默认学习率“optimal”使用。作者：Christian Lorentzen。 #31933
修复 linear_model.LogisticRegressionCV 能够处理某些类别标签在某些折叠中缺失的 CV 分割。以前，当某个类别标签在一个折叠中缺失时，它会引发错误。作者：Christian Lorentzen。 #32747
API 更改 linear_model.PassiveAggressiveClassifier 和 linear_model.PassiveAggressiveRegressor 已被弃用，并将移除（在 1.10 版本中）。等效的估计器可在 linear_model.SGDClassifier 和 SGDRegressor 中找到，它们都公开了 learning_rate="pa1" 和 "pa2" 选项。参数 eta0 可用于指定被引用的论文中称为 C 的 Passive-Aggressive-Algorithms 的攻击性参数。作者：Christian Lorentzen #31932 和 #29097
API 更改 linear_model.SGDClassifier、linear_model.SGDRegressor 和 linear_model.SGDOneClassSVM 现在弃用 power_t 参数的负值。在 1.8 版本中，使用负值会引发警告，在 1.10 版本中将引发错误。取而代之的是必须使用 [0.0, inf) 范围内的值。作者：Ritvi Alagusankar #31474
API 更改当使用 liblinear 求解器且输入 X 值大于 1e30 时，在 sklearn.linear_model.LogisticRegression 中引发错误，否则 liblinear 求解器会冻结。作者：Shruti Nath。 #31888
API 更改 linear_model.LogisticRegressionCV 有了一个新参数 use_legacy_attributes，用于控制拟合属性 C_、l1_ratio_、coefs_paths_、scores_ 和 n_iter_ 的类型和形状。当前默认值 True 保留了旧的行为。如果设置为 False，则
- C_ 是一个浮点数。
- l1_ratio_ 是一个浮点数。
- coefs_paths_ 是一个形状为 (n_folds, n_l1_ratios, n_cs, n_classes, n_features) 的 ndarray。对于二元问题（n_classes=2），倒数第二个维度是 1。
- scores_ 是一个形状为 (n_folds, n_l1_ratios, n_cs) 的 ndarray。
- n_iter_ 是一个形状为 (n_folds, n_l1_ratios, n_cs) 的 ndarray。
在 1.10 版本中，默认值将更改为 False，并且 use_legacy_attributes 将被弃用。在 1.12 版本中，use_legacy_attributes 将被移除。作者：Christian Lorentzen。 #32114
API 更改 linear_model.LogisticRegression 和 linear_model.LogisticRegressionCV 的 penalty 参数已被弃用，并将在 1.10 版本中移除。可以通过以下方式获得等效的行为：
- 对于 linear_model.LogisticRegression
  - 使用 l1_ratio=0 代替 penalty="l2"
  - 使用 l1_ratio=1 代替 penalty="l1"
  - 使用 0<l1_ratio<1 代替 penalty="elasticnet"
  - 使用 C=np.inf 代替 penalty=None
- 对于 linear_model.LogisticRegressionCV
  - 使用 l1_ratios=(0,) 代替 penalty="l2"
  - 使用 l1_ratios=(1,) 代替 penalty="l1"
  - 等同于 penalty=None 的方法是让 np.inf 成为 Cs 参数的元素。
对于 linear_model.LogisticRegression，l1_ratio 的默认值已从 None 更改为 0.0。设置 l1_ratio=None 已弃用，将在 1.10 版本中引发错误。

对于 linear_model.LogisticRegressionCV，l1_ratios 的默认值已从 None 更改为 "warn"。在 1.10 版本中将更改为 (0,)。设置 l1_ratios=None 已弃用，将在 1.10 版本中引发错误。

作者：Christian Lorentzen。 #32659
API 更改 linear_model.LogisticRegression 的 n_jobs 参数已被弃用，并将在 1.10 版本中移除。它自 1.8 版本起已无效果。作者：Loïc Estève。 #32742

`sklearn.manifold`#

主要特性实现了 manifold.ClassicalMDS 以执行经典 MDS（双中心化距离矩阵的特征值分解）。作者：Dmitry Kobak 和 Meekail Zain #31322
特性 manifold.MDS 现在支持任意距离度量（通过 metric 和 metric_params 参数）和通过经典 MDS 进行初始化（通过 init 参数）。dissimilarity 参数已被弃用。metric 旧参数已重命名为 metric_mds。作者：Dmitry Kobak #32229
特性 manifold.TSNE 现在支持稀疏输入矩阵的 PCA 初始化。作者：Arturo Amor。 #32433

`sklearn.metrics`#

特性添加了 metrics.d2_brier_score，该函数计算 Brier 分数的 D^2。作者：Omar Salman。 #28971
特性添加了 metrics.confusion_matrix_at_thresholds 函数，该函数返回每个阈值的真阴性、假阳性、假阴性和真阳性的数量。作者：Success Moses。 #30134
效率在 metrics.d2_log_loss_score 中避免了冗余的输入验证，在大规模基准测试中实现了 1.2 倍的加速。作者：Olivier Grisel 和 Omar Salman #32356
增强 metrics.median_absolute_error 现在支持 Array API 兼容的输入。作者：Lucy Liu。 #31406
增强改进了以下度量的稀疏输入的错误消息：metrics.accuracy_score、metrics.multilabel_confusion_matrix、metrics.jaccard_score、metrics.zero_one_loss、metrics.f1_score、metrics.fbeta_score、metrics.precision_recall_fscore_support、metrics.class_likelihood_ratios、metrics.precision_score、metrics.recall_score、metrics.classification_report、metrics.hamming_loss。作者：Lucy Liu。 #32047
修复当 sample_weight 不为 None 时，metrics.median_absolute_error 现在使用 _averaged_weighted_percentile 而不是 _weighted_percentile 来计算中位数。这相当于使用“averaged_inverted_cdf”而不是“inverted_cdf”分位数方法，如果使用相等权重，结果与 numpy.median 相同。作者：Lucy Liu #30787
修复对 metrics.accuracy_score、metrics.balanced_accuracy_score、metrics.brier_score_loss、metrics.class_likelihood_ratios、metrics.classification_report、metrics.cohen_kappa_score、metrics.confusion_matrix、metrics.f1_score、metrics.fbeta_score、metrics.hamming_loss、metrics.jaccard_score、metrics.matthews_corrcoef、metrics.multilabel_confusion_matrix、metrics.precision_recall_fscore_support、metrics.precision_score、metrics.recall_score 和 metrics.zero_one_loss 添加了额外的 sample_weight 检查。 sample_weight 只能是 1D，长度与 y_true 和 y_pred 一致，并且所有值都必须是有限的且非复数。作者：Lucy Liu。 #31701
修复 y_pred 在 metrics.DetCurveDisplay.from_predictions 和 metrics.PrecisionRecallDisplay.from_predictions 中已弃用，改为使用 y_score。 y_pred 将在 v1.10 中移除。作者：Luis #31764
修复使用 partial score_func 创建的分数器的 repr 现在可以正确工作，并使用给定的 partial 对象的 repr。作者：Adrin Jalali。 #31891
修复 metrics.RocCurveDisplay.from_cv_results 的 curve_kwargs 参数中指定的 kwargs 现在仅在传递给 Matplotlib 的 plot 函数之前覆盖其对应的默认值。以前，传递任何 curve_kwargs 都会覆盖所有默认 kwargs。作者：Lucy Liu。 #32313
修复为 metrics.d2_brier_score 和 metrics.d2_log_loss_score 注册了命名评分器对象，并更新了它们的输入验证，以与相关度量函数保持一致。作者：Olivier Grisel 和 Omar Salman #32356
修复 metrics.RocCurveDisplay.from_cv_results 现在会在 pos_label=None 时，从 cv_results 中使用的估计器推断 pos_label 为 estimator.classes_[-1]。此前，当 pos_label=None 时会引发错误。作者：Lucy Liu。 #32372
修复所有分类指标现在会在所需输入数组（y_pred, y_true, y1, y2, pred_decision, 或 y_proba）为空时引发 ValueError。此前，accuracy_score、class_likelihood_ratios、classification_report、confusion_matrix、hamming_loss、jaccard_score、matthews_corrcoef、multilabel_confusion_matrix 和 precision_recall_fscore_support 并未一致地引发此错误。作者：Stefanie Senger。 #32549
API 变更 metrics.cluster.entropy 已弃用，将在 v1.10 中移除。作者：Lucy Liu #31294
API 变更 metrics.PrecisionRecallDisplay 中的 estimator_name 参数已被弃用，将由 name 参数替代，并将在 1.10 版本中移除。作者：Lucy Liu。 #32310

`sklearn.model_selection`#

增强 model_selection.StratifiedShuffleSplit 在引发 ValueError 时，如果任何类成员少于 2 个，将明确指出是哪些类导致了此问题。这有助于识别导致错误的类。作者：Marc Bresson #32265
在引发 ValueError 时，model_selection.StratifiedShuffleSplit 将会指定哪些类
修复修复了 model_selection.StratifiedGroupKFold 中的 shuffle 行为。现在当 shuffle=True 时，跨折的分层也会被保留。作者：Pau Folch。 #32540

`sklearn.multiclass`#

修复修复了 multiclass.OneVsRestClassifier 中的 tie-breaking 行为，使其与 np.argmax 的 tie-breaking 行为保持一致。作者：Lakshmi Krishnan。 #15504

`sklearn.naive_bayes`#

修复 naive_bayes.GaussianNB 会根据 X 的 dtype 来保留拟合属性的 dtype。作者：Omar Salman #32497

`sklearn.preprocessing`#

增强 preprocessing.SplineTransformer 现在可以通过 handle_missing 参数来处理缺失值。作者：Stefanie Senger。 #28043
增强 preprocessing.PowerTransformer 在逆变换（inverse_transform）时遇到 NaN 值时现在会发出警告，这通常是由极端偏斜的数据引起的。作者：Roberto Mourao #29307
增强 preprocessing.MaxAbsScaler 现在可以通过 clip 参数来裁剪超出范围的持有数据值。作者：Hleb Levitski。 #31790
修复修复了 preprocessing.OneHotEncoder 中的一个 bug，该 bug 导致 handle_unknown='warn' 的行为与 'ignore' 类似，而不是 'infrequent_if_exist'。作者：Nithurshen #32592

`sklearn.semi_supervised`#

修复 semi_supervised.LabelPropagation 中用户编写的核函数结果现在会被归一化，使得所有行和都等于 1，即使核函数给出不对称或非均匀的行和。作者：Dan Schult。 #31924

`sklearn.tree`#

效率带有 criterion="absolute_error" 的 tree.DecisionTreeRegressor 现在运行速度快得多：复杂度为 O(n log n)，而之前是 O(n^2)，这使得它能够处理数百万甚至数亿个数据点。作者：Arthur Lacote #32100
修复使 tree.export_text 成为线程安全的。作者：Olivier Grisel。 #30041
修复如果提供的特征名称不是字符串，export_graphviz 现在会引发 ValueError。作者：Guilherme Peixoto #31036
修复带有 criterion="absolute_error" 的 tree.DecisionTreeRegressor 有时会进行次优分割（即未最小化绝对误差的分割）。现在已修复。因此，重新训练树可能会产生略有不同的结果。作者：Arthur Lacote #32100
修复修复了决策树中几乎恒定特征处理不当的回归问题。作者：Sercan Turkmen。 #32259
修复修复了 tree.DecisionTree*（以及由此衍生的 ensemble.RandomForest*）中包含近乎恒定特征值和缺失值的节点在训练期间的分割逻辑。先前，如果找到恒定特征，即使可以根据缺失值进行更多分割，树也会过早停止。作者：Arthur Lacote #32274
修复修复了树（tree.DecisionTreeClassifier、tree.DecisionTreeRegressor、tree.ExtraTreeClassifier 和 tree.ExtraTreeRegressor）的 decision_path 方法中对缺失值的处理。作者：Arthur Lacote。 #32280
修复修复了包含缺失值的特征在决策树分割时的逻辑。在某些情况下，最后一个非缺失样本没有被正确分区。作者：Tim Head 和 Arthur Lacote。 #32351

`sklearn.utils`#

效率函数 sklearn.utils.extmath.safe_sparse_dot 通过专用的 Cython 例程得到了改进，用于处理 a @ b 的情况，其中 a 是稀疏的二维数组，b 也是稀疏的二维数组，并且需要一个密集输出（即 dense_output=True）。这改进了 scikit-learn 中处理稀疏数组（或矩阵）的多个算法。作者：Christian Lorentzen。 #31952
增强所有 scikit-learn 估计器以及更普遍地继承自 base.BaseEstimator 的估计器的 HTML 表示中的参数表，现在将参数描述显示为工具提示，并且每个参数都有一个指向在线文档的链接。作者：Dea María Léon。 #31564
增强当提供的权重既不是标量也不是与输入数据大小相同的 1D 数组类型时，sklearn.utils._check_sample_weight 现在会引发更清晰的错误消息。作者：Kapil Parekh。 #31873
增强 sklearn.utils.estimator_checks.parametrize_with_checks 现在允许您配置 xfailing 检查的严格模式。意外通过的测试将导致测试失败。默认行为保持不变。作者：Tim Head。 #31951
增强修复了 HTML 表示中“?”和“i”符号的对齐问题，并改进了估计器的 HTML 表示的颜色样式。作者：Guillaume Lemaitre。 #31969
修复更改了将估计器显示为 HTML 表示时选择颜色的方式。颜色不再适应用户的个性化主题，而是根据 VSCode 和 JupyterLab 中声明的主题颜色方案（浅色或深色）进行选择。如果主题未声明颜色方案，则根据页面的默认文本颜色选择方案，如果失败则回退到媒体查询。作者：Matt J.。 #32330
API 变更 utils.extmath.stable_cumsum 已弃用，将在 v1.10 中移除。请使用具有所需 dtype 的 np.cumulative_sum 代替。作者：Tiziano Zito。 #32258

代码和文档贡献者

感谢自 1.7 版本以来为项目的维护和改进做出贡献的所有人，包括

$id, 4hm3d, Acciaro Gennaro Daniele, achyuthan.s, Adam J. Stewart, Adriano Leão, Adrien Linares, Adrin Jalali, Aitsaid Azzedine Idir, Alexander Fabisch, Alexandre Abraham, Andrés H. Zapke, Anne Beyer, Anthony Gitter, AnthonyPrudent, antoinebaker, Arpan Mukherjee, Arthur, Arthur Lacote, Arturo Amor, ayoub.agouzoul, Ayrat, Ayush, Ayush Tanwar, Basile Jezequel, Bhavya Patwa, BRYANT MUSI BABILA, Casey Heath, Chems Ben, Christian Lorentzen, Christian Veenhuis, Christine P. Chai, cstec, C. Titus Brown, Daniel Herrera-Esposito, Dan Schult, dbXD320, Dea María Léon, Deepyaman Datta, dependabot[bot], Dhyey Findoriya, Dimitri Papadopoulos Orfanos, Dipak Dhangar, Dmitry Kobak, elenafillo, Elham Babaei, EmilyXinyi, Emily (Xinyi) Chen, Eugen-Bleck, Evgeni Burovski, fabarca, Fabrizio Damicelli, Faizan-Ul Huda, François Goupil, François Paugam, Gaetan, GaetandeCast, Gesa Loof, Gonçalo Guiomar, Gordon Grey, Gowtham Kumar K., Guilherme Peixoto, Guillaume Lemaitre, hakan çanakçı, Harshil Sanghvi, Henri Bonamy, Hleb Levitski, HulusiOzy, hvtruong, Ian Faust, Imad Saddik, Jérémie du Boisberranger, Jérôme Dockès, John Hendricks, Joris Van den Bossche, Josef Affourtit, Josh, jshn9515, Junaid, KALLA GANASEKHAR, Kapil Parekh, Kenneth Enevoldsen, Kian Eliasi, kostayScr, Krishnan Vignesh, kryggird, Kyle S, Lakshmi Krishnan, Leomax, Loic Esteve, Luca Bittarello, Lucas Colley, Lucy Liu, Luigi Giugliano, Luis, Mahdi Abid, Mahi Dhiman, Maitrey Talware, Mamduh Zabidi, Manikandan Gobalakrishnan, Marc Bresson, Marco Edward Gorelli, Marek Pokropiński, Maren Westermann, Marie Sacksick, Marija Vlajic, Matt J., Mayank Raj, Michael Burkhart, Michael Šimáček, Miguel Fernandes, Miro Hrončok, Mohamed DHIFALLAH, Muhammad Waseem, MUHAMMED SINAN D, Natalia Mokeeva, Nicholas Farr, Nicolas Bolle, Nicolas Hug, nithish-74, Nithurshen, Nitin Pratap Singh, NotAceNinja, Olivier Grisel, omahs, Omar Salman, Patrick Walsh, Peter Holzer, pfolch, ph-ll-pp, Prashant Bansal, Quan H. Nguyen, Radovenchyk, Rafael Ayllón Gavilán, Raghvender, Ranjodh Singh, Ravichandranayakar, Remi Gau, Reshama Shaikh, Richard Harris, RishiP2006, Ritvi Alagusankar, Roberto Mourao, Robert Pollak, Roshangoli, roychan, R Sagar Shresti, Sarthak Puri, saskra, scikit-learn-bot, Scott Huberty, Sercan Turkmen, Sergio P, Shashank S, Shaurya Bisht, Shivam, Shruti Nath, SIKAI ZHANG, sisird864, SiyuJin-1, S. M. Mohiuddin Khan Shiam, Somdutta Banerjee, sotagg, Sota Goto, Spencer Bradkin, Stefan, Stefanie Senger, Steffen Rehberg, Steven Hur, Success Moses, Sylvain Combettes, ThibaultDECO, Thomas J. Fan, Thomas Li, Thomas S., Tim Head, Tingwei Zhu, Tiziano Zito, TJ Norred, Username46786, Utsab Dahal, Vasanth K, Veghit, VirenPassi, Virgil Chan, Vivaan Nanavati, Xiao Yuan, xuzhang0327, Yaroslav Halchenko, Yaswanth Kumar, Zijun yi, zodchi94, Zubair Shakoor