版本 1.5#
有关此版本主要亮点的简要说明,请参阅scikit-learn 1.5 版本亮点。
更新日志图例
主要特性 以前无法实现的重要功能。
特性 以前无法实现的功能。
效率 现有功能现在可能不需要那么多计算或内存。
增强 一些次要的改进。
修复 以前与文档不符或不符合合理预期的问题现在应该已经解决。
API 变更 未来您需要更改代码才能实现相同的效果;或某个功能未来将被移除。
版本 1.5.2#
2024 年 9 月
影响多个模块的变更#
修复 修复了
sklearn._loss
、sklearn.manifold
、sklearn.metrics
和sklearn.utils
中几个 Cython 模块的性能回归问题,这些模块在构建时没有 OpenMP 支持。#29694 by Loïc Estèvce。
更新日志#
sklearn.calibration
#
修复 在
cv
中使用LeaveOneOut
时抛出错误,与使用KFold(n_splits=n_samples)
时的情况一致。#29545 by Lucy Liu
sklearn.compose
#
修复 修复了
compose.TransformedTargetRegressor
在转换输出设置为pandas
或polars
时不会引发UserWarning
的问题,因为它不是一个转换器。#29401 by Stefanie Senger。
sklearn.decomposition
#
修复 提高了
decomposition.FastICA
在使用whiten_solver="eigh"
进行白化步骤时的秩亏损阈值,以提高估计器的平台无关性。#29612 by Olivier Grisel。
sklearn.metrics
#
修复 修复了
metrics.accuracy_score
和metrics.zero_one_loss
中的回归问题,该问题导致 Array API 在多标签输入时报错。#29336 by Edoardo Abati。
sklearn.svm
#
修复 修复了
svm.SVC
和svm.SVR
中的回归问题,使其接受C=float("inf")
。#29780 by Guillaume Lemaitre。
版本 1.5.1#
2024 年 7 月
影响多个模块的变更#
修复 修复了所有估计器输入数据验证中的回归问题,该问题在传递由只读缓冲区支持的 DataFrame 时会引发意外错误。#29018 by Jérémie du Boisberranger。
修复 修复了导致某些设置中在导入时发生死锁的回归问题。#29235 by Jérémie du Boisberranger。
更新日志#
sklearn.compose
#
效率 修复了
compose.ColumnTransformer
中的性能回归问题,该问题导致在n_jobs > 1
时为每个转换器复制完整的输入数据。#29330 by Jérémie du Boisberranger。
sklearn.metrics
#
修复 修复了
metrics.r2_score
中的回归问题。在禁用 Array API 调度的情况下传递 torch CPU 张量,会抱怨非 CPU 设备,而不是隐式地将这些输入转换为常规 NumPy 数组。#29119 by @Olivier Grisel。修复 修复了
metrics.zero_one_loss
中的回归问题,该问题导致 Array API 在多标签输入时报错。#29269 by Yaroslav Korobko。
sklearn.model_selection
#
修复 修复了
model_selection.GridSearchCV
中参数网格具有异构参数值时的回归问题。#29078 by Loïc Estève。修复 修复了
model_selection.GridSearchCV
中参数网格具有估计器作为参数值时的回归问题。#29179 by Marco Gorelli。修复 修复了
model_selection.GridSearchCV
中参数网格具有不同大小数组作为参数值时的回归问题。#29314 by Marco Gorelli。
sklearn.tree
#
修复 修复了
tree.export_graphviz
和tree.plot_tree
中的一个问题,该问题可能导致在 32 位操作系统上出现异常或错误结果。#29327 by Loïc Estève。
sklearn.utils
#
API 变更
utils.validation.check_array
新增参数force_writeable
,用于控制输出数组的可写性。如果设置为True
,则保证输出数组可写,如果输入数组是只读的,则会进行复制。如果设置为False
,则不对输出数组的可写性做任何保证。#29018 by Jérémie du Boisberranger。
版本 1.5.0#
2024 年 5 月
安全#
修复
feature_extraction.text.CountVectorizer
和feature_extraction.text.TfidfVectorizer
不再将其stop_words_
属性中存储来自训练集的已丢弃词元。此属性以前会包含过于频繁(高于max_df
)但也过于稀有(低于min_df
)的词元。这修复了一个潜在的安全问题(数据泄露),即丢弃的稀有词元在模型开发者不知情的情况下可能包含训练集中的敏感信息。注意:建议这些类的用户要么使用新的 scikit-learn 版本重新训练其管道,要么手动清除以前训练的这些转换器实例中的
stop_words_
属性。此属性仅用于模型检查目的,对转换器的行为没有影响。#28823 by Olivier Grisel。
更改的模型#
效率
preprocessing.QuantileTransformer
中的子采样现在对密集数组更高效,但拟合的分位数和transform
的结果可能与以前略有不同(保持相同的统计属性)。#27344 by Xuefeng Xu。增强
decomposition.PCA
、decomposition.SparsePCA
和decomposition.TruncatedSVD
现在根据分量值设置components_
属性的符号,而不是使用转换后的数据作为参考。此更改是为了在所有PCA
求解器(包括此版本中引入的新svd_solver="covariance_eigh"
选项)中提供一致的分量符号。
影响多个模块的变更#
修复 当将 1D 稀疏数组传递给需要 2D 稀疏输入的函数时,引发带有信息性错误消息的
ValueError
。#28988 by Olivier Grisel。API 变更 估计器的
inverse_transform
方法的输入名称已标准化为X
。因此,Xt
已被弃用,并将在 1.7 版本中从以下估计器中移除:cluster.FeatureAgglomeration
、decomposition.MiniBatchNMF
、decomposition.NMF
、model_selection.GridSearchCV
、model_selection.RandomizedSearchCV
、pipeline.Pipeline
和preprocessing.KBinsDiscretizer
。#28756 by Will Dean。
支持 Array API#
额外的估计器和函数已更新,以包含对所有 Array API 兼容输入的支持。
有关更多详细信息,请参阅Array API 支持(实验性)。
函数
sklearn.metrics.r2_score
现在支持 Array API 兼容输入。#27904 by Eric Lindgren、Franck Charras、Olivier Grisel 和 Tim Head。
类
linear_model.Ridge
现在支持svd
求解器的 Array API。有关更多详细信息,请参阅Array API 支持(实验性)。#27800 by Franck Charras、Olivier Grisel 和 Tim Head。
支持使用 Meson 构建#
从 scikit-learn 1.5 开始,Meson 是构建 scikit-learn 的主要支持方式,有关更多详细信息,请参阅从源代码构建。
除非我们发现重大障碍,否则 setuptools 支持将在 scikit-learn 1.6 中删除。1.5.x 版本将支持使用 setuptools 构建 scikit-learn。
对使用 Meson 构建 scikit-learn 的支持已在 #28040 中添加,由 Loïc Estève 贡献。
元数据路由#
以下模型现在在其一个或多个方法中支持元数据路由。有关更多详细信息,请参阅元数据路由用户指南。
特性
impute.IterativeImputer
现在在其fit
方法中支持元数据路由。#28187 by Stefanie Senger。特性
ensemble.BaggingClassifier
和ensemble.BaggingRegressor
现在支持元数据路由。其fit
方法现在接受**fit_params
,这些参数通过其fit
方法传递给底层估计器。#28432 by Adam Li and Benjamin Bossan。特性
linear_model.RidgeCV
和linear_model.RidgeClassifierCV
现在在其fit
方法中支持元数据路由,并将元数据路由到底层model_selection.GridSearchCV
对象或底层评分器。#27560 by Omar Salman。特性
GraphicalLassoCV
现在在其fit
方法中支持元数据路由,并将元数据路由到 CV 分割器。#27566 by Omar Salman。特性
linear_model.RANSACRegressor
现在在其fit
、score
和predict
方法中支持元数据路由,并将元数据路由到其底层估计器的fit
、score
和predict
方法。#28261 by Stefanie Senger。特性
ensemble.VotingClassifier
和ensemble.VotingRegressor
现在支持元数据路由,并将**fit_params
通过其fit
方法传递给底层估计器。#27584 by Stefanie Senger。特性
pipeline.FeatureUnion
现在在其fit
和fit_transform
方法中支持元数据路由,并将元数据路由到底层转换器的fit
和fit_transform
。#28205 by Stefanie Senger。修复 修复了通过类属性设置默认路由请求时的问题。#28435 by Adrin Jalali。
修复 修复了当
set_{method}_request
方法用作未绑定方法时(例如尝试修饰它们时)可能出现的问题。#28651 by Adrin Jalali。修复 防止当估计器使用默认
scoring
参数(None
)路由元数据时,出现RecursionError
。#28712 by Stefanie Senger。
更新日志#
sklearn.calibration
#
修复 修复了
calibration.CalibratedClassifierCV
中的回归问题,该问题在字符串目标时错误地引发了错误。#28843 by Jérémie du Boisberranger。
sklearn.cluster
#
修复
cluster.MeanShift
类现在可以正确地收敛于常量数据。#28951 by Akihiro Kuno。修复 在
OPTICS
的fit
方法中创建预计算稀疏矩阵的副本,以避免稀疏矩阵的原地修改。#28491 by Thanh Lam Dang。修复 当
algorithm="brute"
或"auto"
时,cluster.HDBSCAN
现在支持sklearn.metrics.pairwise_distances
支持的所有度量。#28664 by Manideep Yenugula。
sklearn.compose
#
特性 已拟合的
compose.ColumnTransformer
现在实现了__getitem__
,该方法按名称返回已拟合的转换器。#27990 by Thomas Fan。增强
compose.TransformedTargetRegressor
现在在fit
中,如果仅提供了inverse_func
而未明确设置func
(默认为恒等函数),则会引发错误。#28483 by Stefanie Senger。增强
compose.ColumnTransformer
现在可以在拟合的transformers_
属性中以列名或布尔掩码而非列索引的方式公开“其余”列。#27657 by Jérôme Dockès。修复 修复了
compose.ColumnTransformer
在n_jobs > 1
情况下导致中间选定的列作为只读数组传递给转换器的错误。#28822 by Jérémie du Boisberranger。
sklearn.cross_decomposition
#
修复
cross_decomposition.PLSRegression
的拟合属性coef_
现在在scale=True
时同时考虑了X
和Y
的尺度。请注意,以前的预测值不受此错误影响。#28612 by Guillaume Lemaitre。API 变更
cross_decomposition.PLSRegression
、cross_decomposition.PLSCanonical
、cross_decomposition.CCA
和cross_decomposition.PLSSVD
的 fit、transform 和 inverse_transform 方法中的Y
参数已弃用,建议使用y
。Y
将在 1.7 版本中移除。#28604 by David Leon。
sklearn.datasets
#
增强 为函数
datasets.fetch_20newsgroups
、datasets.fetch_20newsgroups_vectorized
、datasets.fetch_california_housing
、datasets.fetch_covtype
、datasets.fetch_kddcup99
、datasets.fetch_lfw_pairs
、datasets.fetch_lfw_people
、datasets.fetch_olivetti_faces
、datasets.fetch_rcv1
和datasets.fetch_species_distributions
添加了可选参数n_retries
和delay
。默认情况下,这些函数在网络故障时会重试最多 3 次。#28160 by Zhehao Liu and Filip Karlo Došilović。
sklearn.decomposition
#
效率
decomposition.PCA
使用svd_solver="full"
时,现在会分配一个连续的components_
属性,而不是奇异向量的非连续切片。当n_components << n_features
时,这可以节省一些内存,更重要的是,通过利用 BLAS GEMM 在连续数组上的缓存局部性,将后续对transform
方法的调用速度提高一个数量级以上。#27491 by Olivier Grisel。增强 当
svd_solver="auto"
时,PCA
现在会自动为稀疏输入选择 ARPACK 求解器,而不是引发错误。#28498 by Thanh Lam Dang。增强
decomposition.PCA
现在支持名为svd_solver="covariance_eigh"
的新求解器选项,该选项可将具有大量数据点和少量特征(例如,n_samples >> 1000 > n_features
)的数据集的运行速度提高一个数量级并减少内存使用。svd_solver="auto"
选项已更新,可自动为此类数据集使用新求解器。该求解器也接受稀疏输入数据。#27491 by Olivier Grisel。修复
decomposition.PCA
在svd_solver="arpack"
、whiten=True
且n_components
值大于训练集秩的情况下进行拟合时,转换保留数据不再返回无穷大值。#27491 by Olivier Grisel。
sklearn.dummy
#
增强
dummy.DummyClassifier
和dummy.DummyRegressor
在fit
之后现在具有n_features_in_
和feature_names_in_
属性。#27937 by Marco vd Boom。
sklearn.ensemble
#
效率 通过避免调用
predict_proba
,提高了ensemble.HistGradientBoostingClassifier
的predict
运行时。#27844 by Christian Lorentzen。效率
ensemble.HistGradientBoostingClassifier
和ensemble.HistGradientBoostingRegressor
现在通过在寻找分箱阈值之前预先排序数据,使其速度稍快。#28102 by Christian Lorentzen。修复 修复了
ensemble.HistGradientBoostingClassifier
和ensemble.HistGradientBoostingRegressor
在为非分类特征指定monotonic_cst
时的错误。#28925 by Xiao Yuan。
sklearn.feature_extraction
#
效率
feature_extraction.text.TfidfTransformer
现在通过使用 NumPy 向量而不是稀疏矩阵来存储逆文档频率,从而提高了速度和内存效率。#18843 by Paolo Montesel。增强
feature_extraction.text.TfidfTransformer
现在如果输入矩阵的数据类型是np.float64
或np.float32
,则保留其数据类型。#28136 by Guillaume Lemaitre。
sklearn.feature_selection
#
增强
feature_selection.mutual_info_regression
和feature_selection.mutual_info_classif
现在支持n_jobs
参数。#28085 by Neto Menoci and Florin Andrei。增强
feature_selection.RFECV
的cv_results_
属性新增了一个键n_features
,其中包含一个数组,包含每个步骤中选择的特征数量。#28670 by Miguel Silva。
sklearn.impute
#
增强
impute.SimpleImputer
现在通过传递函数而不是策略名称来支持自定义策略。#28053 by Mark Elliot。
sklearn.inspection
#
修复
inspection.DecisionBoundaryDisplay.from_estimator
在提供polars.DataFrame
时不再警告缺少特征名称。#28718 by Patrick Wang。
sklearn.linear_model
#
增强 当
verbose
设置为正值时,linear_model.LogisticRegression
和linear_model.LogisticRegressionCV
中的求解器"newton-cg"
现在会发出信息。#27526 by Christian Lorentzen。修复
linear_model.ElasticNet
、linear_model.ElasticNetCV
、linear_model.Lasso
和linear_model.LassoCV
现在明确不接受大型稀疏数据格式。#27576 by Stefanie Senger。修复
linear_model.RidgeCV
和RidgeClassifierCV
在cv
为 None 时,能够正确地将sample_weight
传递给底层评分器。#27560 by Omar Salman。修复
linear_model.OrthogonalMatchingPursuit
中的n_nonzero_coefs_
属性在设置tol
时将始终为None
,因为在这种情况下会忽略n_nonzero_coefs
。#28557 by Lucy Liu。API 变更
linear_model.RidgeCV
和linear_model.RidgeClassifierCV
现在将允许在cv != None
时使用alpha=0
,这与linear_model.Ridge
和linear_model.RidgeClassifier
保持一致。#28425 by Lucy Liu。API 变更 在
linear_model.PassiveAggressiveClassifier
、linear_model.PassiveAggressiveRegressor
、linear_model.SGDClassifier
、linear_model.SGDRegressor
和linear_model.SGDOneClassSVM
中,将average=0
用于禁用平均值已弃用。请改用average=False
。#28582 by Jérémie du Boisberranger。API 变更
linear_model.LogisticRegression
和linear_model.LogisticRegressionCV
中的参数multi_class
已弃用。multi_class
将在 1.7 版本中移除,内部对于 3 个及以上类将始终使用多项式。如果仍想使用一对多方案,可以使用OneVsRestClassifier(LogisticRegression(..))
。#28703 by Christian Lorentzen。API 变更
store_cv_values
和cv_values_
在~linear_model.RidgeCV
和~linear_model.RidgeClassifierCV
中已弃用,建议使用store_cv_results
和cv_results_
。#28915 by Lucy Liu。
sklearn.manifold
#
API 变更
manifold.TSNE
中的n_iter
已弃用,建议使用max_iter
。n_iter
将在 1.7 版本中移除。这使得manifold.TSNE
与其他估计器保持一致。#28471 by Lucy Liu
sklearn.metrics
#
特性
metrics.pairwise_distances
也接受计算非数值数组的成对距离。这仅通过自定义度量来支持。#27456 by Venkatachalam N、Kshitij Mathur and Julian Libiseller-Egger。特性 当
scoring
是dict
、set
、tuple
或list
时,sklearn.metrics.check_scoring
现在返回一个多指标评分器。#28360 by Thomas Fan。新功能
metrics.d2_log_loss_score
已添加,用于计算对数损失的 D^2 分数。 #28351 由 Omar Salman 贡献。效率提升 提高了函数
brier_score_loss
、calibration_curve
、det_curve
、precision_recall_curve
、roc_curve
的效率,当指定pos_label
参数时。同时提高了RocCurveDisplay
、PrecisionRecallDisplay
、DetCurveDisplay
、CalibrationDisplay
中from_estimator
和from_predictions
方法的效率。 #28051 由 Pierre de Fréminville 贡献。修复
metrics.classification_report
现在只显示准确率,当输入是标签子集时不再显示微平均(micro-average)。 #28399 由 Vineet Joshi 贡献。修复 修复了 OpenBLAS 0.3.26 在 Windows 上进行成对距离计算时出现的死锁问题。这可能会影响基于邻近的算法。 #28692 由 Loïc Estève 贡献。
API 变更
metrics.precision_recall_curve
已弃用关键字参数probas_pred
,转而使用y_score
。probas_pred
将在 1.7 版本中移除。 #28092 由 Adam Li 贡献。API 变更
metrics.brier_score_loss
已弃用关键字参数y_prob
,转而使用y_proba
。y_prob
将在 1.7 版本中移除。 #28092 由 Adam Li 贡献。API 变更 对于分类器和分类指标,以字节编码的标签已弃用,并将在 v1.7 版本中引发错误。 #18555 由 Kaushik Amar Das 贡献。
sklearn.mixture
#
修复
mixture.GaussianMixture
和mixture.BayesianGaussianMixture
的converged_
属性现在反映的是最佳拟合的收敛状态,而之前是如果任一拟合收敛则为True
。 #26837 由 Krsto Proroković 贡献。
sklearn.model_selection
#
重大新功能
model_selection.TunedThresholdClassifierCV
通过交叉验证找到二元分类器中使分类指标最大化的决策阈值。model_selection.FixedThresholdClassifier
是一个替代方案,适用于希望使用固定决策阈值而无需任何调优方案的情况。 #26120 由 Guillaume Lemaitre 贡献。改进 当 `groups` 参数被传递给 split 方法时,那些忽略 `group` 参数的 CV 分割器现在会发出警告。 #28210 由 Thomas Fan 贡献。
改进 当
refit=True
时,GridSearchCV
、RandomizedSearchCV
、HalvingGridSearchCV
和HalvingRandomSearchCV
的 HTML 图示表示将显示最佳估计器。 #28722 由 Yao Xiao 和 Thomas Fan 贡献。修复
model_selection.GridSearchCV
的cv_results_
属性现在返回具有相应 NumPy 数据类型的掩码数组,而不是总是返回 `object` 数据类型。 #28352 由 Marco Gorelli 贡献。修复
model_selection.train_test_split
现在支持 Array API 输入。此前,索引处理不正确,导致在使用 CuPY 等严格的 Array API 实现时引发异常。 #28407 由 Tim Head 贡献。
sklearn.multioutput
#
改进
chain_method
参数已添加到multioutput.ClassifierChain
。 #27700 由 Lucy Liu 贡献。
sklearn.neighbors
#
修复 修复了
neighbors.NeighborhoodComponentsAnalysis
,使其get_feature_names_out
返回正确数量的特征名称。 #28306 由 Brendan Lu 贡献。
sklearn.pipeline
#
新功能
pipeline.FeatureUnion
现在可以使用verbose_feature_names_out
属性。如果为True
,get_feature_names_out
将为所有特征名称添加生成该特征的转换器名称作为前缀。如果为False
,get_feature_names_out
将不为任何特征名称添加前缀,并且如果特征名称不唯一,则会引发错误。 #25991 由 Jiawei Zhang 贡献。
sklearn.preprocessing
#
改进
preprocessing.QuantileTransformer
和preprocessing.quantile_transform
现在明确支持禁用子采样。 #27636 由 Ralph Urlus 贡献。
sklearn.tree
#
改进 通过
tree.plot_tree
在 matplotlib 中绘制树时,现在会显示“True/False”标签,以指示在给定分割条件的情况下样本遍历的方向。 #28552 由 Adam Li 贡献。
sklearn.utils
#
修复
_safe_indexing
现在在 `axis=0` 时可以正确地用于 Polars DataFrame,并支持对 Polars Series 进行索引。 #28521 由 Yao Xiao 贡献。API 变更
utils.IS_PYPY
已弃用,并将在 1.7 版本中移除。 #28768 由 Jérémie du Boisberranger 贡献。API 变更
utils.tosequence
已弃用,并将在 1.7 版本中移除。 #28763 由 Jérémie du Boisberranger 贡献。API 变更
utils.parallel_backend
和utils.register_parallel_backend
已弃用,并将在 1.7 版本中移除。请改用joblib.parallel_backend
和joblib.register_parallel_backend
。 #28847 由 Jérémie du Boisberranger 贡献。API 变更 当标签以字节表示时,
type_of_target
将引发信息性警告消息。对于分类器和分类指标,以字节编码的标签已弃用,并将在 v1.7 版本中引发错误。 #18555 由 Kaushik Amar Das 贡献。API 变更
utils.estimator_checks.check_estimator_sparse_data
已被拆分为两个函数:utils.estimator_checks.check_estimator_sparse_matrix
和utils.estimator_checks.check_estimator_sparse_array
。 #27576 由 Stefanie Senger 贡献。
代码和文档贡献者
感谢自 1.4 版本以来为项目的维护和改进做出贡献的所有人,包括:
101AlexMartin, Abdulaziz Aloqeely, Adam J. Stewart, Adam Li, Adarsh Wase, Adeyemi Biola, Aditi Juneja, Adrin Jalali, Advik Sinha, Aisha, Akash Srivastava, Akihiro Kuno, Alan Guedes, Alberto Torres, Alexis IMBERT, alexqiao, Ana Paula Gomes, Anderson Nelson, Andrei Dzis, Arif Qodari, Arnaud Capitaine, Arturo Amor, Aswathavicky, Audrey Flanders, awwwyan, baggiponte, Bharat Raghunathan, bme-git, brdav, Brendan Lu, Brigitta Sipőcz, Bruno, Cailean Carter, Cemlyn, Christian Lorentzen, Christian Veenhuis, Cindy Liang, Claudio Salvatore Arcidiacono, Connor Boyle, Conrad Stevens, crispinlogan, David Matthew Cherney, Davide Chicco, davidleon123, dependabot[bot], DerWeh, dinga92, Dipan Banik, Drew Craeton, Duarte São José, DUONG, Eddie Bergman, Edoardo Abati, Egehan Gunduz, Emad Izadifar, EmilyXinyi, Erich Schubert, Evelyn, Filip Karlo Došilović, Franck Charras, Gael Varoquaux, Gönül Aycı, Guillaume Lemaitre, Gyeongjae Choi, Harmanan Kohli, Hong Xiang Yue, Ian Faust, Ilya Komarov, itsaphel, Ivan Wiryadi, Jack Bowyer, Javier Marin Tur, Jérémie du Boisberranger, Jérôme Dockès, Jiawei Zhang, João Morais, Joe Cainey, Joel Nothman, Johanna Bayer, John Cant, John Enblom, John Hopfensperger, jpcars, jpienaar-tuks, Julian Chan, Julian Libiseller-Egger, Julien Jerphanion, KanchiMoe, Kaushik Amar Das, keyber, Koustav Ghosh, kraktus, Krsto Proroković, Lars, ldwy4, LeoGrin, lihaitao, Linus Sommer, Loic Esteve, Lucy Liu, Lukas Geiger, m-maggi, manasimj, Manuel Labbé, Manuel Morales, Marco Edward Gorelli, Marco Wolsza, Maren Westermann, Marija Vlajic, Mark Elliot, Martin Helm, Mateusz Sokół, mathurinm, Mavs, Michael Dawson, Michael Higgins, Michael Mayer, miguelcsilva, Miki Watanabe, Mohammed Hamdy, myenugula, Nathan Goldbaum, Naziya Mahimkar, nbrown-ScottLogic, Neto, Nithish Bolleddula, notPlancha, Olivier Grisel, Omar Salman, ParsifalXu, Patrick Wang, Pierre de Fréminville, Piotr, Priyank Shroff, Priyansh Gupta, Priyash Shah, Puneeth K, Rahil Parikh, raisadz, Raj Pulapakura, Ralf Gommers, Ralph Urlus, Randolf Scholz, renaissance0ne, Reshama Shaikh, Richard Barnes, Robert Pollak, Roberto Rosati, Rodrigo Romero, rwelsch427, Saad Mahmood, Salim Dohri, Sandip Dutta, SarahRemus, scikit-learn-bot, Shaharyar Choudhry, Shubham, sperret6, Stefanie Senger, Steffen Schneider, Suha Siddiqui, Thanh Lam DANG, thebabush, Thomas, Thomas J. Fan, Thomas Lazarus, Tialo, Tim Head, Tuhin Sharma, Tushar Parimi, VarunChaduvula, Vineet Joshi, virchan, Waël Boukhobza, Weyb, Will Dean, Xavier Beltran, Xiao Yuan, Xuefeng Xu, Yao Xiao, yareyaredesuyo, Ziad Amerr, Štěpán Sršeň