版本 1.5#
有关此版本主要亮点的简短说明,请参阅 scikit-learn 1.5 的发行亮点。
变更日志图例
主要功能 以前无法实现的重要功能。
功能 以前无法实现的功能。
效率提升 现有功能现在可能不需要那么多计算或内存。
增强 各种各样的次要改进。
修复 以前无法按文档说明(或根据合理预期)工作的内容现在应该可以工作了。
API 变更 您需要更改代码才能在将来获得相同的效果;或者某个功能将在将来被移除。
版本 1.5.2#
2024年9月
影响多个模块的更改#
修复 修复了
sklearn._loss
、sklearn.manifold
、sklearn.metrics
和sklearn.utils
中一些 Cython 模块的性能回归问题,这些模块是在没有 OpenMP 支持的情况下构建的。 #29694 由 Loïc Estèvce 提供。
变更日志#
sklearn.calibration
#
修复 当在
cv
中使用LeaveOneOut
时引发错误,这与使用KFold(n_splits=n_samples)
时发生的情况一致。 #29545 由 Lucy Liu 提供。
sklearn.compose
#
修复 修复了
compose.TransformedTargetRegressor
不会引发UserWarning
的问题,即使转换输出设置为pandas
或polars
,因为它不是转换器。 #29401 由 Stefanie Senger 提供。
sklearn.decomposition
#
修复 在
decomposition.FastICA
的白化步骤中使用whiten_solver="eigh"
时提高秩亏阈值,以提高估计器的平台无关性。 #29612 由 Olivier Grisel 提供。
sklearn.metrics
#
修复 修复了
metrics.accuracy_score
和metrics.zero_one_loss
中的回归问题,该问题会导致使用多标签输入进行数组 API 调度时出现错误。 #29336 由 Edoardo Abati 提供。
sklearn.svm
#
修复 修复了
svm.SVC
和svm.SVR
中的回归问题,以便我们接受C=float("inf")
。 #29780 由 Guillaume Lemaitre 提供。
版本 1.5.1#
2024年7月
影响多个模块的更改#
修复 修复了所有估计器的输入数据验证中的回归问题,其中在传递由只读缓冲区支持的 DataFrame 时会引发意外错误。 #29018 由 Jérémie du Boisberranger 提供。
修复 修复了一个在某些设置下导致导入时死锁的回归问题。 #29235 由 Jérémie du Boisberranger 修复。
变更日志#
sklearn.compose
#
效率提升 修复了
compose.ColumnTransformer
中的性能回归问题,当n_jobs > 1
时,每个转换器都会复制完整的输入数据。 #29330 由 Jérémie du Boisberranger 修复。
sklearn.metrics
#
修复 修复了
metrics.r2_score
的一个回归问题。传递禁用数组 API 调度的 torch CPU 张量会报错非 CPU 设备,而不是将其隐式转换为常规 NumPy 数组。 #29119 由 @Olivier Grisel 修复。修复 修复了
metrics.zero_one_loss
的一个回归问题,该问题导致在使用多标签输入进行数组 API 调度时出错。 #29269 由 Yaroslav Korobko 修复。
sklearn.model_selection
#
修复 修复了
model_selection.GridSearchCV
中针对具有异构参数值的参数网格的回归问题。 #29078 由 Loïc Estève 修复。修复 修复了
model_selection.GridSearchCV
中针对参数网格(其参数值为估计器)的回归问题。 #29179 由 Marco Gorelli 修复。修复 修复了
model_selection.GridSearchCV
中针对参数网格(其参数值为不同大小的数组)的回归问题。 #29314 由 Marco Gorelli 修复。
sklearn.tree
#
修复 修复了
tree.export_graphviz
和tree.plot_tree
中的一个问题,该问题可能在 32 位操作系统上导致异常或错误结果。 #29327 由 Loïc Estève 修复。
sklearn.utils
#
API 变更
utils.validation.check_array
添加了一个新参数force_writeable
,用于控制输出数组的可写性。如果设置为True
,则保证输出数组可写,如果输入数组为只读,则会创建副本。如果设置为False
,则不保证输出数组的可写性。 #29018 由 Jérémie du Boisberranger 添加。
1.5.0 版本#
2024 年 5 月
安全#
修复
feature_extraction.text.CountVectorizer
和feature_extraction.text.TfidfVectorizer
不再将其stop_words_
属性中存储从训练集中丢弃的标记。此属性将保存过于频繁(高于max_df
)但也过于稀少的标记(低于min_df
)。这修复了潜在的安全问题(数据泄漏),如果丢弃的稀有标记包含来自训练集的敏感信息,而模型开发者并不知情。注意:鼓励使用这些类的用户使用新的 scikit-learn 版本重新训练他们的管道,或者手动清除以前训练的这些转换器的
stop_words_
属性。此属性仅用于模型检查,不会影响转换器的行为。#28823 由 Olivier Grisel 完成。
已更改的模型#
效率提升
preprocessing.QuantileTransformer
中的子采样现在对于密集数组更高效,但拟合的分位数和transform
的结果可能与以前略有不同(保持相同的统计特性)。#27344 由 Xuefeng Xu 完成。增强
decomposition.PCA
、decomposition.SparsePCA
和decomposition.TruncatedSVD
现在根据组件值设置components_
属性的符号,而不是使用转换后的数据作为参考。此更改是必要的,以便能够在所有PCA
求解器(包括此版本中引入的新的svd_solver="covariance_eigh"
选项)中提供一致的组件符号。
影响许多模块的更改#
修复 当向期望二维稀疏输入的方法传递一维稀疏数组时,会引发带有信息性错误消息的
ValueError
。#28988 由 Olivier Grisel 完成。API 变更 估计器的
inverse_transform
方法的输入名称已标准化为X
。因此,Xt
已弃用,并将从 1.7 版中删除,以下估计器中受此影响:cluster.FeatureAgglomeration
、decomposition.MiniBatchNMF
、decomposition.NMF
、model_selection.GridSearchCV
、model_selection.RandomizedSearchCV
、pipeline.Pipeline
和preprocessing.KBinsDiscretizer
。#28756 由 Will Dean 完成。
对 Array API 的支持#
其他估计器和函数已更新,以包括对所有符合 Array API 的输入的支持。
有关更多详细信息,请参阅 Array API 支持(实验性)。
函数
sklearn.metrics.r2_score
现在支持符合 Array API 的输入。#27904 由 Eric Lindgren、Franck Charras、Olivier Grisel 和 Tim Head 完成。
类
linear_model.Ridge
现在支持svd
求解器的 Array API。有关更多详细信息,请参阅 Array API 支持(实验性)。#27800 由 Franck Charras、Olivier Grisel 和 Tim Head 完成。
使用 Meson 构建的支持#
从 scikit-learn 1.5 开始,Meson 是构建 scikit-learn 的主要支持方式,有关更多详细信息,请参阅 从源代码构建。
除非我们发现主要的障碍,否则 setuptools 支持将在 scikit-learn 1.6 中被删除。1.5.x 版本将支持使用 setuptools 构建 scikit-learn。
在 #28040 中添加了 scikit-learn 的 Meson 构建支持,由 Loïc Estève 完成。
元数据路由#
以下模型现在支持在其一种或多种方法中进行元数据路由。有关更多详细信息,请参阅 元数据路由用户指南。
功能
impute.IterativeImputer
现在在其fit
方法中支持元数据路由。 #28187 由 Stefanie Senger 完成。功能
ensemble.BaggingClassifier
和ensemble.BaggingRegressor
现在支持元数据路由。其fit
方法现在接受**fit_params
,这些参数将通过其fit
方法传递给底层估计器。 #28432 由 Adam Li 和 Benjamin Bossan 完成。功能
linear_model.RidgeCV
和linear_model.RidgeClassifierCV
现在在其fit
方法中支持元数据路由,并将元数据路由到底层的model_selection.GridSearchCV
对象或底层评分器。 #27560 由 Omar Salman 完成。功能
GraphicalLassoCV
现在在其fit
方法中支持元数据路由,并将元数据路由到交叉验证拆分器。 #27566 由 Omar Salman 完成。功能
linear_model.RANSACRegressor
现在在其fit
、score
和predict
方法中支持元数据路由,并将元数据路由到底层估计器的fit
、score
和predict
方法。 #28261 由 Stefanie Senger 完成。功能
ensemble.VotingClassifier
和ensemble.VotingRegressor
现在支持元数据路由,并将**fit_params
通过其fit
方法传递给底层估计器。 #27584 由 Stefanie Senger 完成。功能
pipeline.FeatureUnion
现在在其fit
和fit_transform
方法中支持元数据路由,并将元数据路由到底层转换器的fit
和fit_transform
。 #28205 由 Stefanie Senger 完成。修复 修复了通过类属性设置默认路由请求时的错误。 #28435 由 Adrin Jalali 完成。
修复 修复了
set_{method}_request
方法作为未绑定方法使用时的错误,如果尝试装饰它们,则可能发生这种情况。 #28651 由 Adrin Jalali 完成。修复 防止当具有默认
scoring
参数(None
)的估计器路由元数据时出现RecursionError
。 #28712 由 Stefanie Senger 完成。
变更日志#
sklearn.calibration
#
修复 修复了
calibration.CalibratedClassifierCV
中的回归问题,其中错误地为字符串目标引发了错误。 #28843 由 Jérémie du Boisberranger 完成。
sklearn.cluster
#
修复
cluster.MeanShift
类现在可以正确地收敛于常数数据。 #28951 由 Akihiro Kuno贡献。修复 在
OPTICS
的fit
方法中创建预计算稀疏矩阵的副本,以避免对稀疏矩阵进行就地修改。 #28491 由 Thanh Lam Dang贡献。修复
cluster.HDBSCAN
现在支持sklearn.metrics.pairwise_distances
支持的所有度量,当algorithm="brute"
或"auto"
时。 #28664 由 Manideep Yenugula贡献。
sklearn.compose
#
功能 已拟合的
compose.ColumnTransformer
现在实现了__getitem__
,它按名称返回拟合的转换器。 #27990 由 Thomas Fan贡献。增强
compose.TransformedTargetRegressor
现在在fit
中引发错误,如果仅提供inverse_func
而没有显式设置func
(默认为恒等式)。 #28483 由 Stefanie Senger贡献。增强
compose.ColumnTransformer
现在可以将拟合的transformers_
属性中的“剩余”列作为列名或布尔掩码公开,而不是列索引。 #27657 由 Jérôme Dockès贡献。修复 修复了
compose.ColumnTransformer
中n_jobs > 1
的一个错误,其中中间选择的列作为只读数组传递给转换器。 #28822 由 Jérémie du Boisberranger贡献。
sklearn.cross_decomposition
#
修复
cross_decomposition.PLSRegression
的拟合属性coef_
现在在scale=True
时考虑了X
和Y
的比例。请注意,之前的预测值不受此错误的影响。 #28612 由 Guillaume Lemaitre贡献。API变更 弃用
Y
,在以下方法中改用y
:cross_decomposition.PLSRegression
、cross_decomposition.PLSCanonical
、cross_decomposition.CCA
和cross_decomposition.PLSSVD
的 fit、transform 和 inverse_transform 方法。Y
将在 1.7 版本中移除。 #28604 由 David Leon贡献。
sklearn.datasets
#
增强 为函数
datasets.fetch_20newsgroups
、datasets.fetch_20newsgroups_vectorized
、datasets.fetch_california_housing
、datasets.fetch_covtype
、datasets.fetch_kddcup99
、datasets.fetch_lfw_pairs
、datasets.fetch_lfw_people
、datasets.fetch_olivetti_faces
、datasets.fetch_rcv1
和datasets.fetch_species_distributions
添加了可选参数n_retries
和delay
。默认情况下,这些函数会在网络故障时最多重试3次。#28160 由 刘哲昊 和 Filip Karlo Došilović 完成。
sklearn.decomposition
#
效率提升 使用
svd_solver="full"
的decomposition.PCA
现在分配一个连续的components_
属性,而不是非连续的奇异向量切片。当n_components << n_features
时,这可以节省一些内存,更重要的是,通过利用连续数组上 BLAS GEMM 的缓存局部性,可以将后续对transform
方法的调用速度提高一个数量级以上。#27491 由 Olivier Grisel 完成。增强 当
svd_solver="auto"
时,PCA
现在会自动为稀疏输入选择 ARPACK 求解器,而不是抛出错误。#28498 由 Thanh Lam Dang 完成。增强
decomposition.PCA
现在支持一个名为svd_solver="covariance_eigh"
的新的求解器选项,该选项对于具有大量数据点和少量特征的数据集(例如,n_samples >> 1000 > n_features
)提供了数量级的速度提升和内存使用减少。svd_solver="auto"
选项已更新为自动为此类数据集使用新的求解器。此求解器也接受稀疏输入数据。#27491 由 Olivier Grisel 完成。修复 使用
svd_solver="arpack"
、whiten=True
和大于训练集秩的n_components
值的decomposition.PCA
拟合,在转换保留数据时不再返回无限值。#27491 由 Olivier Grisel 完成。
sklearn.dummy
#
增强
dummy.DummyClassifier
和dummy.DummyRegressor
现在在fit
之后具有n_features_in_
和feature_names_in_
属性。#27937 由 Marco vd Boom 完成。
sklearn.ensemble
#
效率提升 通过避免调用
predict_proba
,提高了ensemble.HistGradientBoostingClassifier
的predict
的运行时间。#27844 由 Christian Lorentzen 完成。效率提升
ensemble.HistGradientBoostingClassifier
和ensemble.HistGradientBoostingRegressor
现在速度略有提升,这是因为在查找分箱阈值之前预先对数据进行了排序。 #28102 由 Christian Lorentzen 贡献。修复 修复了
ensemble.HistGradientBoostingClassifier
和ensemble.HistGradientBoostingRegressor
在为非类别特征指定monotonic_cst
时的错误。 #28925 由 Xiao Yuan 贡献。
sklearn.feature_extraction
#
效率提升
feature_extraction.text.TfidfTransformer
现在速度更快,内存效率更高,这是因为使用 NumPy 向量而不是稀疏矩阵来存储逆文档频率。 #18843 由 Paolo Montesel 贡献。增强
feature_extraction.text.TfidfTransformer
现在如果输入矩阵的数据类型为np.float64
或np.float32
,则会保留其数据类型。 #28136 由 Guillaume Lemaitre 贡献。
sklearn.feature_selection
#
增强
feature_selection.mutual_info_regression
和feature_selection.mutual_info_classif
现在支持n_jobs
参数。 #28085 由 Neto Menoci 和 Florin Andrei 贡献。增强
feature_selection.RFECV
的cv_results_
属性新增了一个键n_features
,其中包含一个数组,该数组包含每个步骤中选择的特征数量。 #28670 由 Miguel Silva 贡献。
sklearn.impute
#
增强
impute.SimpleImputer
现在支持自定义策略,方法是用函数代替策略名称。 #28053 由 Mark Elliot 贡献。
sklearn.inspection
#
修复
inspection.DecisionBoundaryDisplay.from_estimator
在提供polars.DataFrame
时不再发出有关缺少特征名称的警告。 #28718 由 Patrick Wang 贡献。
sklearn.linear_model
#
增强
linear_model.LogisticRegression
和linear_model.LogisticRegressionCV
中的求解器"newton-cg"
现在在verbose
设置为正值时会发出信息。 #27526 由 Christian Lorentzen 贡献。修复
linear_model.ElasticNet
、linear_model.ElasticNetCV
、linear_model.Lasso
和linear_model.LassoCV
现在明确地不再接受大型稀疏数据格式。 #27576 由 Stefanie Senger 完成。修复
linear_model.RidgeCV
和RidgeClassifierCV
在cv
为 None 时,会正确地将sample_weight
传递给底层的评分器。 #27560 由 Omar Salman 完成。修复
linear_model.OrthogonalMatchingPursuit
中的n_nonzero_coefs_
属性现在在设置tol
时将始终为None
,因为在这种情况下会忽略n_nonzero_coefs
。 #28557 由 Lucy Liu 完成。API 变更
linear_model.RidgeCV
和linear_model.RidgeClassifierCV
现在允许在cv != None
时使用alpha=0
,这与linear_model.Ridge
和linear_model.RidgeClassifier
保持一致。 #28425 由 Lucy Liu 完成。API 变更 在
linear_model.PassiveAggressiveClassifier
、linear_model.PassiveAggressiveRegressor
、linear_model.SGDClassifier
、linear_model.SGDRegressor
和linear_model.SGDOneClassSVM
中,传递average=0
来禁用平均已弃用。请改用average=False
。 #28582 由 Jérémie du Boisberranger 完成。API 变更 参数
multi_class
已在linear_model.LogisticRegression
和linear_model.LogisticRegressionCV
中弃用。multi_class
将在 1.7 版本中移除,内部对于 3 个或更多类别,将始终使用多项式模型。如果您仍然想使用一对多方案,可以使用OneVsRestClassifier(LogisticRegression(..))
。 #28703 由 Christian Lorentzen 完成。API 变更
store_cv_values
和cv_values_
已弃用,推荐使用store_cv_results
和cv_results_
,适用于~linear_model.RidgeCV
和~linear_model.RidgeClassifierCV
。 #28915 由 Lucy Liu 完成。
sklearn.manifold
#
API 变更 弃用
n_iter
,推荐使用max_iter
,适用于manifold.TSNE
。n_iter
将在 1.7 版本中移除。这使得manifold.TSNE
与其他估计器保持一致。 #28471 由 Lucy Liu 完成。
sklearn.metrics
#
新增功能
metrics.pairwise_distances
现在也支持计算非数值数组的成对距离。这仅通过自定义度量标准来支持。#27456 由 Venkatachalam N、Kshitij Mathur 和 Julian Libiseller-Egger 贡献。新增功能
sklearn.metrics.check_scoring
现在当scoring
为dict
、set
、tuple
或list
时,返回一个多指标评分器。#28360 由 Thomas Fan 贡献。新增功能 新增了
metrics.d2_log_loss_score
,用于计算对数损失的 D^2 分数。#28351 由 Omar Salman 贡献。性能提升 提升了函数
brier_score_loss
、calibration_curve
、det_curve
、precision_recall_curve
、roc_curve
在指定pos_label
参数时的效率。还提升了RocCurveDisplay
、PrecisionRecallDisplay
、DetCurveDisplay
、CalibrationDisplay
中from_estimator
和from_predictions
方法的效率。#28051 由 Pierre de Fréminville 贡献。错误修复
metrics.classification_report
现在仅在输入为标签子集时显示准确率,而不显示微平均值。#28399 由 Vineet Joshi 贡献。错误修复 修复了 Windows 系统中 OpenBLAS 0.3.26 在成对距离计算中的死锁问题。这可能会影响基于邻居的算法。#28692 由 Loïc Estève 贡献。
API 变更
metrics.precision_recall_curve
已弃用关键字参数probas_pred
,并将其替换为y_score
。probas_pred
将在 1.7 版本中移除。#28092 由 Adam Li 贡献。API 变更
metrics.brier_score_loss
已弃用关键字参数y_prob
,并将其替换为y_proba
。y_prob
将在 1.7 版本中移除。#28092 由 Adam Li 贡献。API 变更 对于分类器和分类指标,编码为字节的标签已弃用,并在 v1.7 中将引发错误。#18555 由 Kaushik Amar Das 贡献。
sklearn.mixture
#
修复
mixture.GaussianMixture
和mixture.BayesianGaussianMixture
的converged_
属性现在反映的是最佳拟合的收敛状态,而之前如果任何拟合收敛,则该属性为True
。 #26837 由 Krsto Proroković 完成。
sklearn.model_selection
#
主要功能
model_selection.TunedThresholdClassifierCV
通过交叉验证找到使二元分类器分类指标最大化的决策阈值。model_selection.FixedThresholdClassifier
是一种替代方案,当想要使用固定决策阈值而无需任何调整方案时可以使用它。 #26120 由 Guillaume Lemaitre 完成。增强 忽略 group 参数的 CV 分割器 现在在将 groups 传递到 split 时会发出警告。 #28210 由 Thomas Fan 完成。
增强
GridSearchCV
,RandomizedSearchCV
,HalvingGridSearchCV
和HalvingRandomSearchCV
的 HTML 图表表示当refit=True
时将显示最佳估计器。 #28722 由 Yao Xiao 和 Thomas Fan 完成。修复
model_selection.GridSearchCV
的cv_results_
属性现在返回具有适当 NumPy 数据类型的掩码数组,而不是始终返回数据类型object
。 #28352 由 Marco Gorelli 完成。修复
model_selection.train_test_split
可以处理 Array API 输入。之前索引处理不正确,导致使用 CuPY 等 Array API 的严格实现时出现异常。 #28407 由 Tim Head 完成。
sklearn.multioutput
#
增强 向
multioutput.ClassifierChain
添加了chain_method
参数。 #27700 由 Lucy Liu 完成。
sklearn.neighbors
#
修复 修复了
neighbors.NeighborhoodComponentsAnalysis
,以便get_feature_names_out
返回正确的特征名称数量。 #28306 由 Brendan Lu 完成。
sklearn.pipeline
#
功能
pipeline.FeatureUnion
现在可以使用verbose_feature_names_out
属性。如果为True
,get_feature_names_out
将在所有特征名称前加上生成该特征的转换器的名称作为前缀。如果为False
,get_feature_names_out
将不会添加任何前缀,如果特征名称不唯一则会报错。 #25991 由 Jiawei Zhang 完成。
sklearn.preprocessing
#
增强
preprocessing.QuantileTransformer
和preprocessing.quantile_transform
现在支持显式禁用子采样。 #27636 由 Ralph Urlus 贡献。
sklearn.tree
#
增强 通过
tree.plot_tree
在 matplotlib 中绘制树现在会显示“True/False”标签,以指示样本在给定分割条件下遍历的方向。 #28552 由 Adam Li 贡献。
sklearn.utils
#
修复
_safe_indexing
现在在axis=0
时可以正确处理 polars DataFrame,并支持索引 polars Series。 #28521 由 姚晓 贡献。API变更
utils.IS_PYPY
已弃用,将在 1.7 版本中移除。 #28768 由 Jérémie du Boisberranger 贡献。API变更
utils.tosequence
已弃用,将在 1.7 版本中移除。 #28763 由 Jérémie du Boisberranger 贡献。API变更
utils.parallel_backend
和utils.register_parallel_backend
已弃用,将在 1.7 版本中移除。请改用joblib.parallel_backend
和joblib.register_parallel_backend
。 #28847 由 Jérémie du Boisberranger 贡献。API变更 在
type_of_target
中引发信息性警告消息,当目标变量以字节表示时。对于分类器和分类指标,以字节编码的标签已被弃用,将在 v1.7 中引发错误。 #18555 由 Kaushik Amar Das 贡献。API变更
utils.estimator_checks.check_estimator_sparse_data
已拆分为两个函数:utils.estimator_checks.check_estimator_sparse_matrix
和utils.estimator_checks.check_estimator_sparse_array
。 #27576 由 Stefanie Senger 贡献。
代码和文档贡献者
感谢自 1.4 版本以来为项目维护和改进做出贡献的每一个人,包括
101AlexMartin,Abdulaziz Aloqeely,Adam J. Stewart,Adam Li,Adarsh Wase,Adeyemi Biola,Aditi Juneja,Adrin Jalali,Advik Sinha,Aisha,Akash Srivastava,Akihiro Kuno,Alan Guedes,Alberto Torres,Alexis IMBERT,alexqiao,Ana Paula Gomes,Anderson Nelson,Andrei Dzis,Arif Qodari,Arnaud Capitaine,Arturo Amor,Aswathavicky,Audrey Flanders,awwwyan,baggiponte,Bharat Raghunathan,bme-git,brdav,Brendan Lu,Brigitta Sipőcz,Bruno,Cailean Carter,Cemlyn,Christian Lorentzen,Christian Veenhuis,Cindy Liang,Claudio Salvatore Arcidiacono,Connor Boyle,Conrad Stevens,crispinlogan,David Matthew Cherney,Davide Chicco,davidleon123,dependabot[bot],DerWeh,dinga92,Dipan Banik,Drew Craeton,Duarte São José,DUONG,Eddie Bergman,Edoardo Abati,Egehan Gunduz,Emad Izadifar,EmilyXinyi,Erich Schubert,Evelyn,Filip Karlo Došilović,Franck Charras,Gael Varoquaux,Gönül Aycı,Guillaume Lemaitre,Gyeongjae Choi,Harmanan Kohli,Hong Xiang Yue,Ian Faust,Ilya Komarov,itsaphel,Ivan Wiryadi,Jack Bowyer,Javier Marin Tur,Jérémie du Boisberranger,Jérôme Dockès,Jiawei Zhang,João Morais,Joe Cainey,Joel Nothman,Johanna Bayer,John Cant,John Enblom,John Hopfensperger,jpcars,jpienaar-tuks,Julian Chan,Julian Libiseller-Egger,Julien Jerphanion,KanchiMoe,Kaushik Amar Das,keyber,Koustav Ghosh,kraktus,Krsto Proroković,Lars,ldwy4,LeoGrin,lihaitao,Linus Sommer,Loic Esteve,Lucy Liu,Lukas Geiger,m-maggi,manasimj,Manuel Labbé,Manuel Morales,Marco Edward Gorelli,Marco Wolsza,Maren Westermann,Marija Vlajic,Mark Elliot,Martin Helm,Mateusz Sokół,mathurinm,Mavs,Michael Dawson,Michael Higgins,Michael Mayer,miguelcsilva,Miki Watanabe,Mohammed Hamdy,myenugula,Nathan Goldbaum,Naziya Mahimkar,nbrown-ScottLogic,Neto,Nithish Bolleddula,notPlancha,Olivier Grisel,Omar Salman,ParsifalXu,Patrick Wang,Pierre de Fréminville,Piotr,Priyank Shroff,Priyansh Gupta,Priyash Shah,Puneeth K,Rahil Parikh,raisadz,Raj Pulapakura,Ralf Gommers,Ralph Urlus,Randolf Scholz,renaissance0ne,Reshama Shaikh,Richard Barnes,Robert Pollak,Roberto Rosati,Rodrigo Romero,rwelsch427,Saad Mahmood,Salim Dohri,Sandip Dutta,SarahRemus,scikit-learn-bot,Shaharryar Choudhry,Shubham,sperret6,Stefanie Senger,Steffen Schneider,Suha Siddiqui,Thanh Lam DANG,thebabush,Thomas,Thomas J. Fan,Thomas Lazarus,Tialo,Tim Head,Tuhin Sharma,Tushar Parimi,VarunChaduvula,Vineet Joshi,virchan,Waël Boukhobza,Weyb,Will Dean,Xavier Beltran,Xiao Yuan,Xuefeng Xu,Yao Xiao,yareyaredesuyo,Ziad Amerr,Štěpán Sršeň