版本 0.19#

版本 0.19.2#

2018年7月

此版本仅用于支持 Python 3.7。

版本 0.19.1#

2017年10月23日

这是一个错误修复版本,包含一些次要的文档改进以及对 0.19.0 版本中发布的功能的增强。

请注意,此版本中 TSNE 输出可能存在细微差异(由于#9623),在多个样本到某个样本的距离相等的情况下。

变更日志#

API 更改#

  • 回滚了添加metrics.ndcg_scoremetrics.dcg_score的操作,这两个函数由于错误被合并到 0.19.0 版本中。它们的实现已损坏且未记录。

  • 在 0.19.0 版本中添加到model_selection.GridSearchCVmodel_selection.RandomizedSearchCVmodel_selection.cross_validatereturn_train_score参数的默认值将在 0.21 版本中从 True 更改为 False。我们发现,在某些情况下,计算训练分数会对交叉验证运行时间产生很大的影响。如果预测或评分函数很慢,从而对交叉验证运行时间产生不利影响,用户应明确将return_train_score设置为 False;如果他们希望使用计算出的分数,则应将其设置为 True。#9677Kumar AshutoshJoel Nothman提交。

  • 来自旧高斯过程实现的correlation_modelsregression_models已被延迟弃用。#9717Kumar Ashutosh提交。

错误修复#

在 0.19.1 中修复了 0.19.0 中的回归问题

增强功能#

代码和文档贡献者#

感谢

Joel Nothman, Loic Esteve, Andreas Mueller, Kumar Ashutosh, Vrishank Bhardwaj, Hanmin Qin, Rasul Kerimov, James Bourbeau, Nagarjuna Kumar, Nathaniel Saul, Olivier Grisel, Roman Yurchak, Reiichiro Nakano, Sachin Kelkar, Sam Steingold, Yaroslav Halchenko, diegodlh, felix, goncalo-rodrigues, jkleint, oliblum90, pasbi, Anthony Gitter, Ben Lawson, Charlie Brummitt, Didi Bar-Zev, Gael Varoquaux, Joan Massich, Joris Van den Bossche, nielsenmarkus11

0.19版本#

2017年8月12日

亮点#

我们很高兴发布许多很棒的新功能,包括用于异常检测的neighbors.LocalOutlierFactor,用于鲁棒特征转换的preprocessing.QuantileTransformer,以及用于简化多标签问题中类别之间依赖关系的元估计器multioutput.ClassifierChain。我们对现有估计器中添加了一些新的算法,例如decomposition.NMF中的乘法更新和具有L1损失的multinomial linear_model.LogisticRegression(使用solver='saga')。

交叉验证现在能够返回来自多个度量评估的结果。新的model_selection.cross_validate可以返回测试数据上的许多分数以及训练集性能和时间,并且我们扩展了网格/随机搜索的scoringrefit参数以处理多个度量

您还可以更快地学习。例如,缓存转换的新选项pipeline.Pipeline中使得对包括缓慢转换的管道的网格搜索效率更高。而且您可以更快地进行预测:如果您确定知道自己在做什么,您可以使用config_context关闭验证输入是否有限。

我们也进行了一些重要的修复。我们在metrics.average_precision_score中修复了一个长期存在的实现错误,因此请谨慎对待该函数先前报告的结果。 manifold.TSNE实现中的一些错误已得到修复,尤其是在默认的Barnes-Hut近似中。semi_supervised.LabelSpreadingsemi_supervised.LabelPropagation都进行了大量的修复。LabelPropagation之前是损坏的。LabelSpreading现在应该能够正确地遵守其alpha参数。

模型变更#

以下估计器和函数在使用相同的数据和参数拟合时,可能会产生与先前版本不同的模型。这通常是由于建模逻辑的更改(错误修复或增强)或随机抽样过程造成的。

详细信息列在下面的变更日志中。

(虽然我们正在努力通过提供此信息来更好地告知用户,但我们无法保证此列表完整。)

变更日志#

新功能#

分类器和回归器

其他估计器

模型选择和评估

其他

  • 现在可以使用 config_context 抑制输入数据不包含 NaN 或 inf 的验证,但这需要自行承担风险。这将节省运行时间,对于预测时间可能特别有用。#7548Joel Nothman 完成。

  • 添加了一个测试,以确保文档字符串中的参数列表与函数/类的签名匹配。#9206Alexandre GramfortRaghav RV 完成。

增强功能#

树和集成

线性、核化及相关模型

其他预测器

分解、流形学习和聚类

预处理和特征选择

模型评估和元估计器

指标

其他

错误修复#

树和集成

线性、核化及相关模型

其他预测器

分解、流形学习和聚类

预处理和特征选择

模型评估和元估计器

指标

其他

API 变更摘要#

树和集成

  • 梯度提升基模型不再是估计器。由 Andreas Müller 完成。

  • 所有基于树的估计器现在都接受 min_impurity_decrease 参数,代替现已弃用的 min_impurity_split 参数。min_impurity_decrease 有助于停止分割那些分割后的加权不纯度减少不再至少为 min_impurity_decrease 的节点。#8449Raghav RV 完成。

线性、核化及相关模型

其他预测器

分解、流形学习和聚类

预处理和特征选择

模型评估和元估计器

其他

  • 已弃用transforminverse_transform中的y参数。该方法不应该接受y参数,因为它在预测时使用。 #8174Tahar ZanoudaAlexandre GramfortRaghav RV 完成。

  • SciPy >= 0.13.3 和 NumPy >= 1.8.2 现在是 scikit-learn 的最低支持版本。 sklearn.utils 中以下反向移植的函数已被移除或弃用。 #8854#8874Naoya Kanai 完成。

  • discriminant_analysis.QuadraticDiscriminantAnalysisstore_covariancescovariances_ 参数已重命名为 store_covariancecovariance_,以与 discriminant_analysis.LinearDiscriminantAnalysis 的相应参数名称保持一致。它们将在 0.21 版本中移除。 #7998Jiacheng 完成。

    在 0.19 版本中移除

    • utils.fixes.argpartition

    • utils.fixes.array_equal

    • utils.fixes.astype

    • utils.fixes.bincount

    • utils.fixes.expit

    • utils.fixes.frombuffer_empty

    • utils.fixes.in1d

    • utils.fixes.norm

    • utils.fixes.rankdata

    • utils.fixes.safe_copy

    在 0.19 版本中弃用,将在 0.21 版本中移除

    • utils.arpack.eigs

    • utils.arpack.eigsh

    • utils.arpack.svds

    • utils.extmath.fast_dot

    • utils.extmath.logsumexp

    • utils.extmath.norm

    • utils.extmath.pinvh

    • utils.graph.graph_laplacian

    • utils.random.choice

    • utils.sparsetools.connected_components

    • utils.stats.rankdata

  • 现在要求同时具有 decision_functionpredict_proba 方法的估计器在其之间具有单调关系。check_decision_proba_consistency 方法已添加到 **utils.estimator_checks** 中以检查其一致性。 #7578Shubham Bhardwaj 完成。

  • utils.estimator_checks 中的所有检查,特别是 utils.estimator_checks.check_estimator 现在接受估计器实例。大多数其他检查不再接受估计器类。 #9019Andreas Müller 完成。

  • 确保以 _ 结尾的估计器属性不是在构造函数中设置,而只在 fit 方法中设置。最值得注意的是,集成估计器(派生自 ensemble.BaseEnsemble)现在只有在 fit 之后才能使用 self.estimators_#7464Lars BuitinckLoic Esteve 完成。

代码和文档贡献者#

感谢自 0.18 版本以来为项目的维护和改进做出贡献的每一个人,包括

Joel Nothman,Loic Esteve,Andreas Mueller,Guillaume Lemaitre,Olivier Grisel,Hanmin Qin,Raghav RV,Alexandre Gramfort,themrmax,Aman Dalmia,Gael Varoquaux,Naoya Kanai,Tom Dupré la Tour,Rishikesh,Nelson Liu,Taehoon Lee,Nelle Varoquaux,Aashil,Mikhail Korobov,Sebastin Santy,Joan Massich,Roman Yurchak,RAKOTOARISON Herilalaina,Thierry Guillemot,Alexandre Abadie,Carol Willing,Balakumaran Manoharan,Josh Karnofsky,Vlad Niculae,Utkarsh Upadhyay,Dmitry Petrov,Minghui Liu,Srivatsan,Vincent Pham,Albert Thomas,Jake VanderPlas,Attractadore,JC Liu,alexandercbooth,chkoar,Óscar Nájera,Aarshay Jain,Kyle Gilliam,Ramana Subramanyam,CJ Carey,Clement Joudet,David Robles,He Chen,Joris Van den Bossche,Karan Desai,Katie Luangkote,Leland McInnes,Maniteja Nandana,Michele Lacchia,Sergei Lebedev,Shubham Bhardwaj,akshay0724,omtcyfz,rickiepark,waterponey,Vathsala Achar,jbDelafosse,Ralf Gommers,Ekaterina Krivich,Vivek Kumar,Ishank Gulati,Dave Elliott,ldirer,Reiichiro Nakano,Levi John Wolf,Mathieu Blondel,Sid Kapur,Dougal J. Sutherland,midinas,mikebenfield,Sourav Singh,Aseem Bansal,Ibraim Ganiev,Stephen Hoover,AishwaryaRK,Steven C. Howell,Gary Foreman,Neeraj Gangwar,Tahar,Jon Crall,dokato,Kathy Chen,ferria,Thomas Moreau,Charlie Brummitt,Nicolas Goix,Adam Kleczewski,Sam Shleifer,Nikita Singh,Basil Beirouti,Giorgio Patrini,Manoj Kumar,Rafael Possas,James Bourbeau,James A. Bednar,Janine Harper,Jaye,Jean Helie,Jeremy Steward,Artsiom,John Wei,Jonathan LIgo,Jonathan Rahn,seanpwilliams,Arthur Mensch,Josh Levy,Julian Kuhlmann,Julien Aubert,Jörn Hees,Kai,shivamgargsya,Kat Hempstalk,Kaushik Lakshmikanth,Kennedy,Kenneth Lyons,Kenneth Myers,Kevin Yap,Kirill Bobyrev,Konstantin Podshumok,Arthur Imbert,Lee Murray,toastedcornflakes,Lera,Li Li,Arthur Douillard,Mainak Jas,tobycheese,Manraj Singh,Manvendra Singh,Marc Meketon,MarcoFalke,Matthew Brett,Matthias Gilch,Mehul Ahuja,Melanie Goetz,Meng Peng,Michael Dezube,Michal Baumgartner,vibrantabhi19,Artem Golubin,Milen Paskov,Antonin Carette,Morikko,MrMjauh,NALEPA Emmanuel,Namiya,Antoine Wendlinger,Narine Kokhlikyan,NarineK,Nate Guerin,Angus Williams,Ang Lu,Nicole Vavrova,Nitish Pandey,Okhlopkov Daniil Olegovich,Andy Craze,Om Prakash,Parminder Singh,Patrick Carlson,Patrick Pei,Paul Ganssle,Paulo Haddad,Paweł Lorek,Peng Yu,Pete Bachant,Peter Bull,Peter Csizsek,Peter Wang,Pieter Arthur de Jong,Ping-Yao Chang,Preston Parry,Puneet Mathur,Quentin Hibon,Andrew Smith,Andrew Jackson,1kastner,Rameshwar Bhaskaran,Rebecca Bilbro,Remi Rampin,Andrea Esuli,Rob Hall,Robert Bradshaw,Romain Brault,Aman Pratik,Ruifeng Zheng,Russell Smith,Sachin Agarwal,Sailesh Choyal,Samson Tan,Samuël Weber,Sarah Brown,Sebastian Pölsterl,Sebastian Raschka,Sebastian Saeger,Alyssa Batula,Abhyuday Pratap Singh,Sergey Feldman,Sergul Aydore,Sharan Yalburgi,willduan,Siddharth Gupta,Sri Krishna,Almer,Stijn Tonk,Allen Riddell,Theofilos Papapanagiotou,Alison,Alexis Mignon,Tommy Boucher,Tommy Löfstedt,Toshihiro Kamishima,Tyler Folkman,Tyler Lanigan,Alexander Junge,Varun Shenoy,Victor Poughon,Vilhelm von Ehrenheim,Aleksandr Sandrovskii,Alan Yee,Vlasios Vasileiou,Warut Vijitbenjaronk,Yang Zhang,Yaroslav Halchenko,Yichuan Liu,Yuichi Fujikawa,affanv14,aivision2020,xor,andreh7,brady salz,campustrampus,Agamemnon Krasoulis,ditenberg,elena-sharova,filipj8,fukatani,gedeck,guiniol,guoci,hakaa1,hongkahjun,i-am-xhy,jakirkham,jaroslaw-weber,jayzed82,jeroko,jmontoyam,jonathan.striebel,josephsalmon,jschendel,leereeves,martin-hahn,mathurinm,mehak-sachdeva,mlewis1724,mlliou112,mthorrell,ndingwall,nuf,yangarbiter,plagree,pldtc325,Breno Freitas,Brett Olsen,Brian A. Alfano,Brian Burns,polmauri,Brandon Carter,Charlton Austin,Chayant T15h,Chinmaya Pancholi,Christian Danielsen,Chung Yen,Chyi-Kwei Yau,pravarmahajan,DOHMATOB Elvis,Daniel LeJeune,Daniel Hnyk,Darius Morawiec,David DeTomaso,David Gasquez,David Haberthür,David Heryanto,David Kirkby,David Nicholson,rashchedrin,Deborah Gertrude Digges,Denis Engemann,Devansh D,Dickson,Bob Baxley,Don86,E. Lynch-Klarup,Ed Rogers,Elizabeth Ferriss,Ellen-Co2,Fabian Egli,Fang-Chieh Chou,Bing Tian Dai,Greg Stupp,Grzegorz Szpak,Bertrand Thirion,Hadrien Bertrand,Harizo Rajaona,zxcvbnius,Henry Lin,Holger Peters,Icyblade Dai,Igor Andriushchenko,Ilya,Isaac Laughlin,Iván Vallés,Aurélien Bellet,JPFrancoia,Jacob Schreiber,Asish Mahapatra