版本 1.5#
有关此版本主要亮点简短说明,请参阅scikit-learn 1.5 版本亮点。
更新日志图例
重大功能 以前无法实现的大功能。
功能 以前无法实现的功能。
效率提升 现有功能现在可能不需要那么多计算或内存。
增强 一般性的小改进。
修复 以前无法按文档或合理预期工作的问题现在应该可以了。
API 变更 未来你需要更改代码才能达到相同的效果;或者未来某个功能将被移除。
版本 1.5.2#
2024 年 9 月
影响多个模块的变更#
修复 修复了
sklearn._loss、sklearn.manifold、sklearn.metrics和sklearn.utils中几个 Cython 模块的性能回归问题,这些模块在构建时没有 OpenMP 支持。由 Loïc Estèvce 在 #29694 中修复。
更新日志#
sklearn.calibration#
修复 在
cv中使用LeaveOneOut时引发错误,这与使用KFold(n_splits=n_samples)时发生的情况一致。由 Lucy Liu 在 #29545 中修复。
sklearn.compose#
修复 修复了
compose.TransformedTargetRegressor在 transform 输出设置为pandas或polars时不会引发UserWarning的问题,因为它不是一个转换器。由 Stefanie Senger 在 #29401 中修复。
sklearn.decomposition#
修复 增加了
decomposition.FastICA中whiten_solver="eigh"的白化步骤中的秩亏阈值,以提高估计器的平台无关性。由 Olivier Grisel 在 #29612 中修复。
sklearn.metrics#
修复 修复了
metrics.accuracy_score和metrics.zero_one_loss中的一个回归问题,该问题导致使用多标签输入进行 Array API 调度时出错。由 Edoardo Abati 在 #29336 中修复。
sklearn.svm#
修复 修复了
svm.SVC和svm.SVR中的一个回归问题,使其接受C=float("inf")。由 Guillaume Lemaitre 在 #29780 中修复。
版本 1.5.1#
2024 年 7 月
影响多个模块的更改#
修复 修复了所有估计器输入数据验证中的一个回归问题,该问题在传递由只读缓冲区支持的 DataFrame 时会引发意外错误。由 Jérémie du Boisberranger 在 #29018 中修复。
修复 修复了在某些设置下导致导入时死锁的回归问题。由 Jérémie du Boisberranger 在 #29235 中修复。
更新日志#
sklearn.compose#
效率 修复了
compose.ColumnTransformer中的性能回归问题,该问题在n_jobs > 1时为每个转换器复制完整的输入数据。由 Jérémie du Boisberranger 在 #29330 中修复。
sklearn.metrics#
修复 修复了
metrics.r2_score中的一个回归问题。在禁用 Array API 调度的情况下传递 torch CPU 张量时,它会抱怨非 CPU 设备,而不是隐式地将这些输入转换为常规 NumPy 数组。由 @Olivier Grisel 在 #29119 中修复。修复 修复了
metrics.zero_one_loss中的一个回归问题,该问题导致使用多标签输入进行 Array API 调度时出错。由 Yaroslav Korobko 在 #29269 中修复。
sklearn.model_selection#
修复 修复了
model_selection.GridSearchCV中参数网格具有异构参数值时的回归问题。由 Loïc Estève 在 #29078 中修复。修复 修复了
model_selection.GridSearchCV中参数网格具有估计器作为参数值时的回归问题。由 Marco Gorelli 在 #29179 中修复。修复 修复了
model_selection.GridSearchCV中参数网格具有不同大小数组作为参数值时的回归问题。由 Marco Gorelli 在 #29314 中修复。
sklearn.tree#
修复 修复了
tree.export_graphviz和tree.plot_tree中的一个问题,该问题可能导致 32 位操作系统上出现异常或错误结果。由 Loïc Estève 在 #29327 中修复。
sklearn.utils#
API 变更
utils.validation.check_array有一个新的参数force_writeable,用于控制输出数组的可写性。如果设置为True,则保证输出数组可写,如果输入数组是只读的,则会进行复制。如果设置为False,则不对输出数组的可写性做出保证。由 Jérémie du Boisberranger 在 #29018 中添加。
版本 1.5.0#
2024 年 5 月
安全#
修复
feature_extraction.text.CountVectorizer和feature_extraction.text.TfidfVectorizer不再将其stop_words_属性中存储训练集中丢弃的标记。此属性将包含过于频繁(高于max_df)但也过于稀有(低于min_df)的标记。如果丢弃的稀有标记包含来自训练集的敏感信息而模型开发人员不知情,这可以修复潜在的安全问题(数据泄露)。注意:建议这些类的用户要么使用新版本的 scikit-learn 重新训练其管道,要么手动清除以前训练的这些转换器实例中的
stop_words_属性。此属性仅用于模型检查目的,对转换器的行为没有影响。由 Olivier Grisel 在 #28823 中修复。
变更模型#
效率
preprocessing.QuantileTransformer中的子采样现在对于密集数组更有效率,但拟合的分位数和transform的结果可能与以前略有不同(保持相同的统计特性)。由 Xuefeng Xu 在 #27344 中修复。增强
decomposition.PCA、decomposition.SparsePCA和decomposition.TruncatedSVD现在根据分量值设置components_属性的符号,而不是使用转换后的数据作为参考。此更改是为了能够在所有PCA求解器中提供一致的分量符号,包括此版本中引入的新选项svd_solver="covariance_eigh"。由 Olivier Grisel 在 #27491 中修复。
影响多个模块的更改#
修复 在传递期望 2D 稀疏输入的 1D 稀疏数组时,引发带有信息性错误消息的
ValueError。由 Olivier Grisel 在 #28988 中修复。API 变更 估计器
inverse_transform方法的输入名称已标准化为X。因此,在以下估计器中,Xt已弃用,并将在 1.7 版本中删除:cluster.FeatureAgglomeration、decomposition.MiniBatchNMF、decomposition.NMF、model_selection.GridSearchCV、model_selection.RandomizedSearchCV、pipeline.Pipeline和preprocessing.KBinsDiscretizer。由 Will Dean 在 #28756 中修复。
支持 Array API#
已更新其他估计器和函数以包含对所有 Array API 兼容输入的支持。
有关详细信息,请参阅 Array API 支持(实验性)。
函数
sklearn.metrics.r2_score现在支持 Array API 兼容输入。由 Eric Lindgren、Franck Charras、Olivier Grisel 和 Tim Head 在 #27904 中修复。
类别数
linear_model.Ridge现在支持用于svd求解器的 Array API。有关详细信息,请参阅Array API 支持(实验性)。由 Franck Charras、Olivier Grisel 和 Tim Head 在 #27800 中修复。
对使用 Meson 构建的支持#
从 scikit-learn 1.5 开始,Meson 是主要的受支持的构建 scikit-learn 的方式。
除非我们发现重大障碍,否则 setuptools 支持将在 scikit-learn 1.6 中删除。1.5.x 版本将支持使用 setuptools 构建 scikit-learn。
对使用 Meson 构建 scikit-learn 的支持由 Loïc Estève 在 #28040 中添加。
元数据路由#
以下模型现在在其一个或多个方法中支持元数据路由。有关详细信息,请参阅元数据路由用户指南。
新功能
impute.IterativeImputer现在在其fit方法中支持元数据路由。由 Stefanie Senger 在 #28187 中添加。新功能
ensemble.BaggingClassifier和ensemble.BaggingRegressor现在支持元数据路由。fit 方法现在接受**fit_params,这些参数通过其fit方法传递给底层估计器。由 Adam Li 和 Benjamin Bossan 在 #28432 中添加。新功能
linear_model.RidgeCV和linear_model.RidgeClassifierCV现在在其fit方法中支持元数据路由,并将元数据路由到底层model_selection.GridSearchCV对象或底层评分器。由 Omar Salman 在 #27560 中添加。新功能
GraphicalLassoCV现在在其fit方法中支持元数据路由,并将元数据路由到 CV 分割器。由 Omar Salman 在 #27566 中添加。新功能
linear_model.RANSACRegressor现在在其fit、score和predict方法中支持元数据路由,并将元数据路由到其底层估计器的fit、score和predict方法。由 Stefanie Senger 在 #28261 中添加。新功能
ensemble.VotingClassifier和ensemble.VotingRegressor现在支持元数据路由,并通过其fit方法将**fit_params传递给底层估计器。由 Stefanie Senger 在 #27584 中添加。新功能
pipeline.FeatureUnion现在在其fit和fit_transform方法中支持元数据路由,并将元数据路由到底层转换器的fit和fit_transform。由 Stefanie Senger 在 #28205 中添加。修复 修复了通过类属性设置默认路由请求时解析的问题。由 Adrin Jalali 在 #28435 中修复。
修复 修复了当
set_{method}_request方法用作未绑定方法时的问题,这在尝试装饰它们时可能发生。由 Adrin Jalali 在 #28651 中修复。修复 防止在具有默认
scoring参数(None)的估计器路由元数据时发生RecursionError。由 Stefanie Senger 在 #28712 中修复。
更新日志#
sklearn.calibration#
修复 修复了
calibration.CalibratedClassifierCV中的一个回归问题,该问题在传递字符串目标时错误地引发了错误。由 Jérémie du Boisberranger 在 #28843 中修复。
sklearn.cluster#
修复
cluster.MeanShift类现在可以正确地收敛于常量数据。由 Akihiro Kuno 在 #28951 中修复。修复 在
OPTICS的fit方法中创建预计算稀疏矩阵的副本,以避免稀疏矩阵的原地修改。由 Thanh Lam Dang 在 #28491 中修复。修复 当
algorithm="brute"或"auto"时,cluster.HDBSCAN现在支持sklearn.metrics.pairwise_distances支持的所有度量。由 Manideep Yenugula 在 #28664 中修复。
sklearn.compose#
新功能 拟合的
compose.ColumnTransformer现在实现了__getitem__,它按名称返回拟合的转换器。由 Thomas Fan 在 #27990 中添加。增强
compose.TransformedTargetRegressor现在在fit中如果仅提供了inverse_func而未明确设置func(默认设置为恒等),则会引发错误。由 Stefanie Senger 在 #28483 中添加。增强
compose.ColumnTransformer现在可以在拟合的transformers_属性中将“剩余”列公开为列名或布尔掩码,而不是列索引。由 Jérôme Dockès 在 #27657 中添加。修复 修复了
compose.ColumnTransformer中n_jobs > 1时的错误,其中间选择的列作为只读数组传递给转换器。由 Jérémie du Boisberranger 在 #28822 中修复。
sklearn.cross_decomposition#
修复
cross_decomposition.PLSRegression的拟合属性coef_现在在scale=True时考虑了X和Y的比例。请注意,以前的预测值不受此错误影响。由 Guillaume Lemaitre 在 #28612 中修复。API 变更 在以下方法的
fit、transform和inverse_transform方法中弃用Y,转而使用y:cross_decomposition.PLSRegression、cross_decomposition.PLSCanonical和cross_decomposition.CCA,以及以下方法的fit和transform方法:cross_decomposition.PLSSVD。Y将在 1.7 版本中删除。由 David Leon 在 #28604 中修复。
sklearn.datasets#
增强 为函数
datasets.fetch_20newsgroups、datasets.fetch_20newsgroups_vectorized、datasets.fetch_california_housing、datasets.fetch_covtype、datasets.fetch_kddcup99、datasets.fetch_lfw_pairs、datasets.fetch_lfw_people、datasets.fetch_olivetti_faces、datasets.fetch_rcv1和datasets.fetch_species_distributions添加了可选参数n_retries和delay。默认情况下,如果出现网络故障,函数将重试最多 3 次。由 Zhehao Liu 和 Filip Karlo Došilović 在 #28160 中添加。
sklearn.decomposition#
效率
decomposition.PCA使用svd_solver="full"时,现在分配一个连续的components_属性,而不是奇异向量的非连续切片。当n_components << n_features时,这可以节省一些内存,更重要的是,通过利用 BLAS GEMM 在连续数组上的缓存局部性,将后续对transform方法的调用速度提高一个数量级以上。由 Olivier Grisel 在 #27491 中修复。增强 当
svd_solver="auto"时,PCA现在会自动为稀疏输入选择 ARPACK 求解器,而不是引发错误。由 Thanh Lam Dang 在 #28498 中修复。增强
decomposition.PCA现在支持名为svd_solver="covariance_eigh"的新求解器选项,该选项对于具有大量数据点和少量特征(例如,n_samples >> 1000 > n_features)的数据集提供了数量级的加速并减少了内存使用。已更新svd_solver="auto"选项,以便自动为此类数据集使用新求解器。此求解器还接受稀疏输入数据。由 Olivier Grisel 在 #27491 中修复。修复
decomposition.PCA拟合时使用svd_solver="arpack"、whiten=True和一个大于训练集秩的n_components值,在转换保留数据时不再返回无限值。由 Olivier Grisel 在 #27491 中修复。
sklearn.dummy#
增强
dummy.DummyClassifier和dummy.DummyRegressor在fit之后现在具有n_features_in_和feature_names_in_属性。由 Marco vd Boom 在 #27937 中添加。
sklearn.ensemble#
效率 通过避免调用
predict_proba,提高了ensemble.HistGradientBoostingClassifier的predict运行时间。由 Christian Lorentzen 在 #27844 中修复。效率
ensemble.HistGradientBoostingClassifier和ensemble.HistGradientBoostingRegressor现在通过在查找分箱阈值之前对数据进行预排序而略微加快。由 Christian Lorentzen 在 #28102 中修复。修复 修复了
ensemble.HistGradientBoostingClassifier和ensemble.HistGradientBoostingRegressor在为非分类特征指定monotonic_cst时的错误。由 Xiao Yuan 在 #28925 中修复。
sklearn.feature_extraction#
效率
feature_extraction.text.TfidfTransformer现在通过使用 NumPy 向量而不是稀疏矩阵来存储逆文档频率,从而更快且更节省内存。由 Paolo Montesel 在 #18843 中修复。增强
feature_extraction.text.TfidfTransformer现在保留输入矩阵的数据类型(如果是np.float64或np.float32)。由 Guillaume Lemaitre 在 #28136 中修复。
sklearn.feature_selection#
增强
feature_selection.mutual_info_regression和feature_selection.mutual_info_classif现在支持n_jobs参数。由 Neto Menoci 和 Florin Andrei 在 #28085 中添加。增强
feature_selection.RFECV的cv_results_属性有一个新的键n_features,其中包含一个数组,该数组包含每一步选择的特征数。由 Miguel Silva 在 #28670 中添加。
sklearn.impute#
增强
impute.SimpleImputer现在支持通过传递函数代替策略名称来自定义策略。由 Mark Elliot 在 #28053 中添加。
sklearn.inspection#
修复
inspection.DecisionBoundaryDisplay.from_estimator在提供polars.DataFrame时不再警告缺少特征名称。由 Patrick Wang 在 #28718 中修复。
sklearn.linear_model#
增强 当
verbose设置为正值时,linear_model.LogisticRegression和linear_model.LogisticRegressionCV中的求解器"newton-cg"现在会发出信息。由 Christian Lorentzen 在 #27526 中修复。修复
linear_model.ElasticNet、linear_model.ElasticNetCV、linear_model.Lasso和linear_model.LassoCV现在明确不接受大型稀疏数据格式。由 Stefanie Senger 在 #27576 中修复。修复 当
cv为 None 时,linear_model.RidgeCV和RidgeClassifierCV正确地将sample_weight传递给底层评分器。由 Omar Salman 在 #27560 中修复。修复
linear_model.OrthogonalMatchingPursuit中的n_nonzero_coefs_属性现在在设置tol时始终为None,因为在这种情况下n_nonzero_coefs被忽略。由 Lucy Liu 在 #28557 中修复。API 变更
linear_model.RidgeCV和linear_model.RidgeClassifierCV现在允许cv != None时alpha=0,这与linear_model.Ridge和linear_model.RidgeClassifier一致。由 Lucy Liu 在 #28425 中修复。API 变更 在
linear_model.PassiveAggressiveClassifier、linear_model.PassiveAggressiveRegressor、linear_model.SGDClassifier、linear_model.SGDRegressor和linear_model.SGDOneClassSVM中,弃用average=0以禁用平均。请改为传递average=False。由 Jérémie du Boisberranger 在 #28582 中修复。API 变更 在
linear_model.LogisticRegression和linear_model.LogisticRegressionCV中弃用参数multi_class。multi_class将在 1.8 中删除,在内部,对于 3 个及以上的类别,它将始终使用多项式。如果仍然想使用 one-vs-rest 方案,可以使用OneVsRestClassifier(LogisticRegression(..))。由 Christian Lorentzen 在 #28703 中修复。API 变更 在
~linear_model.RidgeCV和~linear_model.RidgeClassifierCV中,弃用参数store_cv_values和cv_values_,转而使用store_cv_results和cv_results_。由 Lucy Liu 在 #28915 中修复。
sklearn.manifold#
API 变更 在
manifold.TSNE中弃用n_iter,转而使用max_iter。n_iter将在 1.7 版本中删除。这使得manifold.TSNE与其他估计器保持一致。由 Lucy Liu 在 #28471 中修复。
sklearn.metrics#
新功能
metrics.pairwise_distances也接受计算非数字数组的成对距离。这仅通过自定义度量支持。由 Venkatachalam N、Kshitij Mathur 和 Julian Libiseller-Egger 在 #27456 中添加。新功能 当
scoring作为dict、set、tuple或list时,sklearn.metrics.check_scoring现在返回一个多指标评分器。由 Thomas Fan 在 #28360 中添加。新功能 已添加
metrics.d2_log_loss_score,用于计算对数损失的 D^2 分数。由 Omar Salman 在 #28351 中添加。效率 在指定
pos_label参数时,提高了函数brier_score_loss、calibration_curve、det_curve、precision_recall_curve、roc_curve的效率。还提高了RocCurveDisplay、PrecisionRecallDisplay、DetCurveDisplay、CalibrationDisplay中from_estimator和from_predictions方法的效率。由 Pierre de Fréminville 在 #28051 中修复。修复 当输入是标签子集时,
metrics.classification_report现在只显示准确度,而不显示微平均。由 Vineet Joshi 在 #28399 中修复。修复 修复了 Windows 上 OpenBLAS 0.3.26 在成对距离计算中死锁的问题。这可能会影响基于邻近度的算法。由 Loïc Estève 在 #28692 中修复。
API 变更
metrics.precision_recall_curve弃用了关键字参数probas_pred,转而使用y_score。probas_pred将在 1.7 版本中删除。由 Adam Li 在 #28092 中修复。API 变更
metrics.brier_score_loss弃用了关键字参数y_prob,转而使用y_proba。y_prob将在 1.7 版本中删除。由 Adam Li 在 #28092 中修复。API 变更 对于分类器和分类指标,用字节编码的标签已弃用,并将在 v1.7 中引发错误。由 Kaushik Amar Das 在 #18555 中修复。
sklearn.mixture#
修复
mixture.GaussianMixture和mixture.BayesianGaussianMixture的converged_属性现在反映最佳拟合的收敛状态,而以前是如果任何拟合收敛则为True。由 Krsto Proroković 在 #26837 中修复。
sklearn.model_selection#
重要新功能
model_selection.TunedThresholdClassifierCV通过交叉验证找到最大化分类指标的二元分类器的决策阈值。model_selection.FixedThresholdClassifier是另一种选择,用于在不需要任何调整方案的情况下使用固定决策阈值。由 Guillaume Lemaitre 在 #26120 中添加。增强 忽略组参数的 CV 分割器 现在在将组传递给 split 时会发出警告。由 Thomas Fan 在 #28210 中添加。
增强
GridSearchCV、RandomizedSearchCV、HalvingGridSearchCV和HalvingRandomSearchCV的 HTML 图表表示现在在refit=True时会显示最佳估计器。由 Yao Xiao 和 Thomas Fan 在 #28722 中添加。修复
model_selection.GridSearchCV的cv_results_属性现在返回适当 NumPy dtype 的掩码数组,而不是始终返回 dtypeobject。由 Marco Gorelli 在 #28352 中修复。修复
model_selection.train_test_split现在支持 Array API 输入。以前,索引处理不正确,导致在使用 CuPY 等严格实现 Array API 时出现异常。 #28407,由 Tim Head 提交。
sklearn.multioutput#
增强
multioutput.ClassifierChain添加了chain_method参数。 #27700,由 Lucy Liu 提交。
sklearn.neighbors#
修复 修复了
neighbors.NeighborhoodComponentsAnalysis,使其get_feature_names_out返回正确数量的特征名称。 #28306,由 Brendan Lu 提交。
sklearn.pipeline#
新功能
pipeline.FeatureUnion现在可以使用verbose_feature_names_out属性。如果设置为True,get_feature_names_out会在所有特征名称前加上生成该特征的转换器的名称。如果设置为False,get_feature_names_out不会在特征名称前加上前缀,如果特征名称不唯一则会报错。 #25991,由 Jiawei Zhang 提交。
sklearn.preprocessing#
增强
preprocessing.QuantileTransformer和preprocessing.quantile_transform现在支持显式禁用子采样。 #27636,由 Ralph Urlus 提交。
sklearn.tree#
增强 通过
tree.plot_tree在 matplotlib 中绘制决策树时,现在会显示“True/False”标签,以指示样本根据分割条件遍历的方向。 #28552,由 Adam Li 提交。
sklearn.utils#
修复
_safe_indexing现在在axis=0时可以正确处理 polars DataFrame,并支持对 polars Series 进行索引。 #28521,由 Yao Xiao 提交。API 变更
utils.IS_PYPY已弃用,并将在 1.7 版本中移除。 #28768,由 Jérémie du Boisberranger 提交。API 变更
utils.tosequence已弃用,并将在 1.7 版本中移除。 #28763,由 Jérémie du Boisberranger 提交。API 变更
utils.parallel_backend和utils.register_parallel_backend已弃用,并将在 1.7 版本中移除。请改用joblib.parallel_backend和joblib.register_parallel_backend。 #28847,由 Jérémie du Boisberranger 提交。API 变更 当目标表示为字节时,
type_of_target会发出有意义的警告消息。对于分类器和分类指标,将标签编码为字节已弃用,并将在 v1.7 中引发错误。 #18555,由 Kaushik Amar Das 提交。API 变更
utils.estimator_checks.check_estimator_sparse_data被拆分为两个函数:utils.estimator_checks.check_estimator_sparse_matrix和utils.estimator_checks.check_estimator_sparse_array。 #27576,由 Stefanie Senger 提交。
代码和文档贡献者
感谢自 1.4 版本以来为项目维护和改进做出贡献的所有人,包括
101AlexMartin, Abdulaziz Aloqeely, Adam J. Stewart, Adam Li, Adarsh Wase, Adeyemi Biola, Aditi Juneja, Adrin Jalali, Advik Sinha, Aisha, Akash Srivastava, Akihiro Kuno, Alan Guedes, Alberto Torres, Alexis IMBERT, alexqiao, Ana Paula Gomes, Anderson Nelson, Andrei Dzis, Arif Qodari, Arnaud Capitaine, Arturo Amor, Aswathavicky, Audrey Flanders, awwwyan, baggiponte, Bharat Raghunathan, bme-git, brdav, Brendan Lu, Brigitta Sipőcz, Bruno, Cailean Carter, Cemlyn, Christian Lorentzen, Christian Veenhuis, Cindy Liang, Claudio Salvatore Arcidiacono, Connor Boyle, Conrad Stevens, crispinlogan, David Matthew Cherney, Davide Chicco, davidleon123, dependabot[bot], DerWeh, dinga92, Dipan Banik, Drew Craeton, Duarte São José, DUONG, Eddie Bergman, Edoardo Abati, Egehan Gunduz, Emad Izadifar, EmilyXinyi, Erich Schubert, Evelyn, Filip Karlo Došilović, Franck Charras, Gael Varoquaux, Gönül Aycı, Guillaume Lemaitre, Gyeongjae Choi, Harmanan Kohli, Hong Xiang Yue, Ian Faust, Ilya Komarov, itsaphel, Ivan Wiryadi, Jack Bowyer, Javier Marin Tur, Jérémie du Boisberranger, Jérôme Dockès, Jiawei Zhang, João Morais, Joe Cainey, Joel Nothman, Johanna Bayer, John Cant, John Enblom, John Hopfensperger, jpcars, jpienaar-tuks, Julian Chan, Julian Libiseller-Egger, Julien Jerphanion, KanchiMoe, Kaushik Amar Das, keyber, Koustav Ghosh, kraktus, Krsto Proroković, Lars, ldwy4, LeoGrin, lihaitao, Linus Sommer, Loic Esteve, Lucy Liu, Lukas Geiger, m-maggi, manasimj, Manuel Labbé, Manuel Morales, Marco Edward Gorelli, Marco Wolsza, Maren Westermann, Marija Vlajic, Mark Elliot, Martin Helm, Mateusz Sokół, mathurinm, Mavs, Michael Dawson, Michael Higgins, Michael Mayer, miguelcsilva, Miki Watanabe, Mohammed Hamdy, myenugula, Nathan Goldbaum, Naziya Mahimkar, nbrown-ScottLogic, Neto, Nithish Bolleddula, notPlancha, Olivier Grisel, Omar Salman, ParsifalXu, Patrick Wang, Pierre de Fréminville, Piotr, Priyank Shroff, Priyansh Gupta, Priyash Shah, Puneeth K, Rahil Parikh, raisadz, Raj Pulapakura, Ralf Gommers, Ralph Urlus, Randolf Scholz, renaissance0ne, Reshama Shaikh, Richard Barnes, Robert Pollak, Roberto Rosati, Rodrigo Romero, rwelsch427, Saad Mahmood, Salim Dohri, Sandip Dutta, SarahRemus, scikit-learn-bot, Shaharyar Choudhry, Shubham, sperret6, Stefanie Senger, Steffen Schneider, Suha Siddiqui, Thanh Lam DANG, thebabush, Thomas, Thomas J. Fan, Thomas Lazarus, Tialo, Tim Head, Tuhin Sharma, Tushar Parimi, VarunChaduvula, Vineet Joshi, virchan, Waël Boukhobza, Weyb, Will Dean, Xavier Beltran, Xiao Yuan, Xuefeng Xu, Yao Xiao, yareyaredesuyo, Ziad Amerr, Štěpán Sršeň