版本 0.19#

版本 0.19.2#

2018年7月

此版本仅用于支持 Python 3.7。

版本 0.19.1#

2017年10月23日

这是一个错误修复版本,包含一些小的文档改进以及对 0.19.0 版本中发布的功能的增强。

请注意,此版本中 TSNE 的输出可能存在细微差异(由于 #9623),这发生在多个样本到某个样本的距离相等的情况下。

更新日志#

API 变更#

  • 撤销了因错误合并到 0.19.0 版本中的 metrics.ndcg_scoremetrics.dcg_score。这些实现存在问题且未文档化。

  • return_train_score 在 0.19.0 版本中被添加到 model_selection.GridSearchCVmodel_selection.RandomizedSearchCVmodel_selection.cross_validate,其默认值将在 0.21 版本中从 True 更改为 False。我们发现,在某些情况下,计算训练分数可能会对交叉验证的运行时产生很大影响。如果预测或评分函数较慢,从而对 CV 运行时产生不利影响,用户应明确将 return_train_score 设置为 False;如果他们希望使用计算出的分数,则应将其设置为 True。#9677Kumar AshutoshJoel Nothman 贡献。

  • 旧版高斯过程实现中的 correlation_modelsregression_models 已延迟弃用。#9717Kumar Ashutosh 贡献。

错误修复#

0.19.0 版本中的回归问题在 0.19.1 版本中得到修复

改进#

代码和文档贡献者#

特别感谢

Joel Nothman, Loic Esteve, Andreas Mueller, Kumar Ashutosh, Vrishank Bhardwaj, Hanmin Qin, Rasul Kerimov, James Bourbeau, Nagarjuna Kumar, Nathaniel Saul, Olivier Grisel, Roman Yurchak, Reiichiro Nakano, Sachin Kelkar, Sam Steingold, Yaroslav Halchenko, diegodlh, felix, goncalo-rodrigues, jkleint, oliblum90, pasbi, Anthony Gitter, Ben Lawson, Charlie Brummitt, Didi Bar-Zev, Gael Varoquaux, Joan Massich, Joris Van den Bossche, nielsenmarkus11

版本 0.19#

2017年8月12日

亮点#

我们很高兴发布了一些出色的新功能,包括用于异常检测的 neighbors.LocalOutlierFactor、用于鲁棒特征转换的 preprocessing.QuantileTransformer,以及用于简单处理多标签问题中类别间依赖关系的元估计器 multioutput.ClassifierChain。我们还在现有估计器中添加了一些新算法,例如 decomposition.NMF 中的乘法更新和带有 L1 损失的多项式 linear_model.LogisticRegression(使用 solver='saga')。

交叉验证现在能够返回多个度量评估的结果。新的 model_selection.cross_validate 可以返回测试数据上的多个分数以及训练集的性能和时间,并且我们扩展了网格/随机搜索的 scoringrefit 参数,以处理多个度量

您还可以学得更快。例如,pipeline.Pipeline缓存转换的新选项使得对包含慢速转换的管道进行网格搜索效率更高。您也可以更快地进行预测:如果您确定自己在做什么,可以使用 config_context 关闭验证输入是否有限的检查。

我们还进行了一些重要的修复。我们修复了 metrics.average_precision_score 中一个长期存在的实现错误,因此请对该函数报告的先前结果保持谨慎。manifold.TSNE 实现中的许多错误已得到修复,特别是在默认的 Barnes-Hut 近似中。semi_supervised.LabelSpreadingsemi_supervised.LabelPropagation 进行了实质性修复。LabelPropagation 之前是损坏的。LabelSpreading 现在应该正确地遵循其 alpha 参数。

更改的模型#

以下估计器和函数,当使用相同数据和参数进行拟合时,可能会产生与先前版本不同的模型。这通常是由于建模逻辑(错误修复或增强)或随机抽样程序中的变化引起的。

详情请参阅下面的更新日志。

(尽管我们正在努力通过提供此信息来更好地告知用户,但我们不能保证此列表是完整的。)

更新日志#

新功能#

分类器和回归器

其他估计器

模型选择和评估

杂项

  • 现在可以使用 config_context 抑制输入数据不包含 NaN 或 inf 的验证,风险自负。这将节省运行时,并且对于预测时间可能特别有用。#7548Joel Nothman 贡献。

  • 添加了一个测试,以确保文档字符串中的参数列表与函数/类签名匹配。#9206Alexandre GramfortRaghav RV 贡献。

改进#

树模型和集成模型

线性、核化及相关模型

其他预测器

分解、流形学习和聚类

预处理和特征选择

模型评估和元估计器

指标

杂项

错误修复#

树模型和集成模型

线性、核化及相关模型

其他预测器

分解、流形学习和聚类

预处理和特征选择

模型评估和元估计器

指标

杂项

API 变更摘要#

树模型和集成模型

  • 梯度提升基本模型不再是估计器。由 Andreas Müller 贡献。

  • 所有基于树的估计器现在都接受 min_impurity_decrease 参数,以替代现已弃用的 min_impurity_splitmin_impurity_decrease 有助于停止分裂加权不纯度降低不再至少为 min_impurity_decrease 的节点。 #8449Raghav RV 贡献。

线性、核化及相关模型

其他预测器

分解、流形学习和聚类

预处理和特征选择

模型评估和元估计器

杂项

  • 弃用 transforminverse_transform 中的 y 参数。该方法不应接受 y 参数,因为它是在预测时使用的。 #8174Tahar ZanoudaAlexandre GramfortRaghav RV 贡献。

  • SciPy >= 0.13.3 和 NumPy >= 1.8.2 现在是 scikit-learn 支持的最低版本。因此,sklearn.utils 中以下反向移植的函数已被移除或弃用。 #8854#8874Naoya Kanai 贡献。

  • discriminant_analysis.QuadraticDiscriminantAnalysisstore_covariancescovariances_ 参数已重命名为 store_covariancecovariance_,以与 discriminant_analysis.LinearDiscriminantAnalysis 的相应参数名称保持一致。它们将在 0.21 版本中移除。 #7998Jiacheng 贡献。

    在 0.19 版本中移除

    • utils.fixes.argpartition

    • utils.fixes.array_equal

    • utils.fixes.astype

    • utils.fixes.bincount

    • utils.fixes.expit

    • utils.fixes.frombuffer_empty

    • utils.fixes.in1d

    • utils.fixes.norm

    • utils.fixes.rankdata

    • utils.fixes.safe_copy

    在 0.19 版本中弃用,将在 0.21 版本中移除

    • utils.arpack.eigs

    • utils.arpack.eigsh

    • utils.arpack.svds

    • utils.extmath.fast_dot

    • utils.extmath.logsumexp

    • utils.extmath.norm

    • utils.extmath.pinvh

    • utils.graph.graph_laplacian

    • utils.random.choice

    • utils.sparsetools.connected_components

    • utils.stats.rankdata

  • 现在要求同时具有 decision_functionpredict_proba 方法的估计器之间具有单调关系。在 utils.estimator_checks 中添加了 check_decision_proba_consistency 方法来检查它们的一致性。 #7578Shubham Bhardwaj 贡献。

  • utils.estimator_checks 中的所有检查,特别是 utils.estimator_checks.check_estimator,现在都接受估计器实例。大多数其他检查不再接受估计器类。 #9019Andreas Müller 贡献。

  • 确保估计器的以 _ 结尾的属性不在构造函数中设置,而仅在 fit 方法中设置。最值得注意的是,集成估计器(派生自 ensemble.BaseEnsemble)现在仅在 fit 之后才具有 self.estimators_#7464Lars BuitinckLoic Esteve 贡献。

代码和文档贡献者#

感谢自 0.18 版本以来为项目维护和改进做出贡献的每个人,包括:

Joel Nothman, Loic Esteve, Andreas Mueller, Guillaume Lemaitre, Olivier Grisel, Hanmin Qin, Raghav RV, Alexandre Gramfort, themrmax, Aman Dalmia, Gael Varoquaux, Naoya Kanai, Tom Dupré la Tour, Rishikesh, Nelson Liu, Taehoon Lee, Nelle Varoquaux, Aashil, Mikhail Korobov, Sebastin Santy, Joan Massich, Roman Yurchak, RAKOTOARISON Herilalaina, Thierry Guillemot, Alexandre Abadie, Carol Willing, Balakumaran Manoharan, Josh Karnofsky, Vlad Niculae, Utkarsh Upadhyay, Dmitry Petrov, Minghui Liu, Srivatsan, Vincent Pham, Albert Thomas, Jake VanderPlas, Attractadore, JC Liu, alexandercbooth, chkoar, Óscar Nájera, Aarshay Jain, Kyle Gilliam, Ramana Subramanyam, CJ Carey, Clement Joudet, David Robles, He Chen, Joris Van den Bossche, Karan Desai, Katie Luangkote, Leland McInnes, Maniteja Nandana, Michele Lacchia, Sergei Lebedev, Shubham Bhardwaj, akshay0724, omtcyfz, rickiepark, waterponey, Vathsala Achar, jbDelafosse, Ralf Gommers, Ekaterina Krivich, Vivek Kumar, Ishank Gulati, Dave Elliott, ldirer, Reiichiro Nakano, Levi John Wolf, Mathieu Blondel, Sid Kapur, Dougal J. Sutherland, midinas, mikebenfield, Sourav Singh, Aseem Bansal, Ibraim Ganiev, Stephen Hoover, AishwaryaRK, Steven C. Howell, Gary Foreman, Neeraj Gangwar, Tahar, Jon Crall, dokato, Kathy Chen, ferria, Thomas Moreau, Charlie Brummitt, Nicolas Goix, Adam Kleczewski, Sam Shleifer, Nikita Singh, Basil Beirouti, Giorgio Patrini, Manoj Kumar, Rafael Possas, James Bourbeau, James A. Bednar, Janine Harper, Jaye, Jean Helie, Jeremy Steward, Artsiom, John Wei, Jonathan LIgo, Jonathan Rahn, seanpwilliams, Arthur Mensch, Josh Levy, Julian Kuhlmann, Julien Aubert, Jörn Hees, Kai, shivamgargsya, Kat Hempstalk, Kaushik Lakshmikanth, Kennedy, Kenneth Lyons, Kenneth Myers, Kevin Yap, Kirill Bobyrev, Konstantin Podshumok, Arthur Imbert, Lee Murray, toastedcornflakes, Lera, Li Li, Arthur Douillard, Mainak Jas, tobycheese, Manraj Singh, Manvendra Singh, Marc Meketon, MarcoFalke, Matthew Brett, Matthias Gilch, Mehul Ahuja, Melanie Goetz, Meng, Peng, Michael Dezube, Michal Baumgartner, vibrantabhi19, Artem Golubin, Milen Paskov, Antonin Carette, Morikko, MrMjauh, NALEPA Emmanuel, Namiya, Antoine Wendlinger, Narine Kokhlikyan, NarineK, Nate Guerin, Angus Williams, Ang Lu, Nicole Vavrova, Nitish Pandey, Okhlopkov Daniil Olegovich, Andy Craze, Om Prakash, Parminder Singh, Patrick Carlson, Patrick Pei, Paul Ganssle, Paulo Haddad, Paweł Lorek, Peng Yu, Pete Bachant, Peter Bull, Peter Csizsek, Peter Wang, Pieter Arthur de Jong, Ping-Yao, Chang, Preston Parry, Puneet Mathur, Quentin Hibon, Andrew Smith, Andrew Jackson, 1kastner, Rameshwar Bhaskaran, Rebecca Bilbro, Remi Rampin, Andrea Esuli, Rob Hall, Robert Bradshaw, Romain Brault, Aman Pratik, Ruifeng Zheng, Russell Smith, Sachin Agarwal, Sailesh Choyal, Samson Tan, Samuël Weber, Sarah Brown, Sebastian Pölsterl, Sebastian Raschka, Sebastian Saeger, Alyssa Batula, Abhyuday Pratap Singh, Sergey Feldman, Sergul Aydore, Sharan Yalburgi, willduan, Siddharth Gupta, Sri Krishna, Almer, Stijn Tonk, Allen Riddell, Theofilos Papapanagiotou, Alison, Alexis Mignon, Tommy Boucher, Tommy Löfstedt, Toshihiro Kamishima, Tyler Folkman, Tyler Lanigan, Alexander Junge, Varun Shenoy, Victor Poughon, Vilhelm von Ehrenheim, Aleksandr Sandrovskii, Alan Yee, Vlasios Vasileiou, Warut Vijitbenjaronk, Yang Zhang, Yaroslav Halchenko, Yichuan Liu, Yuichi Fujikawa, affanv14, aivision2020, xor, andreh7, brady salz, campustrampus, Agamemnon Krasoulis, ditenberg, elena-sharova, filipj8, fukatani, gedeck, guiniol, guoci, hakaa1, hongkahjun, i-am-xhy, jakirkham, jaroslaw-weber, jayzed82, jeroko, jmontoyam, jonathan.striebel, josephsalmon, jschendel, leereeves, martin-hahn, mathurinm, mehak-sachdeva, mlewis1729, mlliou112, mthorrell, ndingwall, nuffe, yangarbiter, plagree, pldtc325, Breno Freitas, Brett Olsen, Brian A. Alfano, Brian Burns, polmauri, Brandon Carter, Charlton Austin, Chayant T15h, Chinmaya Pancholi, Christian Danielsen, Chung Yen, Chyi-Kwei Yau, pravarmahajan, DOHMATOB Elvis, Daniel LeJeune, Daniel Hnyk, Darius Morawiec, David DeTomaso, David Gasquez, David Haberthür, David Heryanto, David Kirkby, David Nicholson, rashchedrin, Deborah Gertrude Digges, Denis Engemann, Devansh D, Dickson, Bob Baxley, Don86, E. Lynch-Klarup, Ed Rogers, Elizabeth Ferriss, Ellen-Co2, Fabian Egli, Fang-Chieh Chou, Bing Tian Dai, Greg Stupp, Grzegorz Szpak, Bertrand Thirion, Hadrien Bertrand, Harizo Rajaona, zxcvbnius, Henry Lin, Holger Peters, Icyblade Dai, Igor Andriushchenko, Ilya, Isaac Laughlin, Iván Vallés, Aurélien Bellet, JPFrancoia, Jacob Schreiber, Asish Mahapatra