版本 0.17#

版本 0.17.1#

2016年2月18日

变更日志#

错误修复#

  • 将内部使用的joblib升级到0.9.4版本,修复了joblib.Parallel中的一个重要错误,该错误在处理大于1MB的数据集时可能会默默地产生错误的结果: joblib/joblib

  • 修复了读取使用scikit-learn版本<= 0.16生成的Bunch pickle的问题。这可能会影响已经使用scikit-learn 0.16下载数据集并使用scikit-learn 0.17加载数据集的用户。请参阅 #6196了解这如何影响 datasets.fetch_20newsgroups。由 Loic Esteve 完成。

  • 修复了一个错误,该错误阻止使用ROC AUC评分在大型数组的多个CPU/核心上执行网格搜索。请参阅 #6147Olivier Grisel 完成。

  • 修复了一个错误,该错误阻止在 ensemble.GradientBoostingRegressor 中正确设置presort参数。请参阅 #5857 由Andrew McCulloh完成。

  • 修复了在评估decomposition.LatentDirichletAllocation模型的困惑度时出现的joblib错误。请参阅 #6258 由Chyi-Kwei Yau完成。

版本 0.17#

2015年11月5日

变更日志#

新特性#

增强功能#

错误修复#

API变更总结#

  • preprocessing.MinMaxScaler中,属性data_mindata_maxdata_range已弃用,将在0.19版本中移除。现在该类公开data_min_data_max_data_range_属性作为替代。By Giorgio Patrini

  • 所有Scaler类现在都有一个scale_属性,表示其transform方法应用的特征级重新缩放。在preprocessing.StandardScaler中,旧属性std_已弃用,并被scale_取代;它将在0.19版本中移除。By Giorgio Patrini

  • svm.SVCsvm.NuSVC现在具有一个decision_function_shape参数,可以通过设置decision_function_shape='ovr'来使其决策函数的形状为(n_samples, n_classes)。从0.19版本开始,这将是默认行为。By Andreas Müller

  • 将一维数据数组作为输入传递给估计器现在已弃用,因为它会导致对数组元素应如何解释为特征或样本的混淆。现在所有数据数组都应明确地形成为(n_samples, n_features)。By Vighnesh Birodkar

  • lda.LDAqda.QDA已移至discriminant_analysis.LinearDiscriminantAnalysisdiscriminant_analysis.QuadraticDiscriminantAnalysis

  • store_covariancetol参数已从discriminant_analysis.LinearDiscriminantAnalysis的fit方法移至构造函数,store_covariancestol参数已从discriminant_analysis.QuadraticDiscriminantAnalysis的fit方法移至构造函数。

  • 继承自_LearntSelectorMixin的模型将不再支持transform方法。(例如,RandomForests、GradientBoosting、LogisticRegression、DecisionTrees、SVMs和SGD相关的模型)。将这些模型包装在元转换器feature_selection.SelectFromModel中,以移除低于某个阈值的特征(根据coefs_feature_importances_)。

  • cluster.KMeans在不收敛的情况下重新运行聚类分配,以确保predict(X)labels_的一致性。By Vighnesh Birodkar

  • 分类器和回归器模型现在使用_estimator_type属性进行标记。

  • 交叉验证迭代器始终提供训练集和测试集的索引,而不是布尔掩码。

  • 所有回归器的decision_function方法已弃用,并将从0.19版本中移除。请改用predict方法。

  • datasets.load_lfw_pairs已弃用,并将从0.19版本中移除。请改用datasets.fetch_lfw_pairs

  • 已弃用的hmm模块已移除。

  • 已弃用的Bootstrap交叉验证迭代器已移除。

  • 已弃用的WardWardAgglomerative类已移除。请改用cluster.AgglomerativeClustering

  • cross_validation.check_cv现在是一个公共函数。

  • linear_model.LinearRegression的属性residues_已弃用,并将从0.19版本中移除。

  • linear_model.LinearRegression已弃用的n_jobs参数已移至构造函数。

  • 已移除linear_model.SGDClassifierfit 方法中已弃用的 class_weight 参数。请改用构造参数。

  • 已移除对序列的序列(或列表的列表)多标签格式的已弃用支持。要转换到和从支持的二元指示矩阵格式转换,请使用MultiLabelBinarizer

  • Pipeline.pipelineinverse_transform 方法的调用行为将在 0.19 版本中发生变化。它将不再将一维输入重塑为二维输入。

  • 已移除preprocessing.LabelBinarizer 的已弃用属性 indicator_matrix_multilabel_classes_

  • svm.SVCsvm.SVR 中使用 gamma=0 来自动将 gamma 设置为 1. / n_features 已被弃用,并将从 0.19 版本中移除。请改用 gamma="auto"

代码贡献者#

Aaron Schumacher, Adithya Ganesh, akitty, Alexandre Gramfort, Alexey Grigorev, Ali Baharev, Allen Riddell, Ando Saabas, Andreas Mueller, Andrew Lamb, Anish Shah, Ankur Ankan, Anthony Erlinger, Ari Rouvinen, Arnaud Joly, Arnaud Rachez, Arthur Mensch, banilo, Barmaley.exe, benjaminirving, Boyuan Deng, Brett Naul, Brian McFee, Buddha Prakash, Chi Zhang, Chih-Wei Chang, Christof Angermueller, Christoph Gohlke, Christophe Bourguignat, Christopher Erick Moody, Chyi-Kwei Yau, Cindy Sridharan, CJ Carey, Clyde-fare, Cory Lorenz, Dan Blanchard, Daniel Galvez, Daniel Kronovet, Danny Sullivan, Data1010, David, David D Lowe, David Dotson, djipey, Dmitry Spikhalskiy, Donne Martin, Dougal J. Sutherland, Dougal Sutherland, edson duarte, Eduardo Caro, Eric Larson, Eric Martin, Erich Schubert, Fernando Carrillo, Frank C. Eckert, Frank Zalkow, Gael Varoquaux, Ganiev Ibraim, Gilles Louppe, Giorgio Patrini, giorgiop, Graham Clenaghan, Gryllos Prokopis, gwulfs, Henry Lin, Hsuan-Tien Lin, Immanuel Bayer, Ishank Gulati, Jack Martin, Jacob Schreiber, Jaidev Deshpande, Jake Vanderplas, Jan Hendrik Metzen, Jean Kossaifi, Jeffrey04, Jeremy, jfraj, Jiali Mei, Joe Jevnik, Joel Nothman, John Kirkham, John Wittenauer, Joseph, Joshua Loyal, Jungkook Park, KamalakerDadi, Kashif Rasul, Keith Goodman, Kian Ho, Konstantin Shmelkov, Kyler Brown, Lars Buitinck, Lilian Besson, Loic Esteve, Louis Tiao, maheshakya, Maheshakya Wijewardena, Manoj Kumar, MarkTab marktab.net, Martin Ku, Martin Spacek, MartinBpr, martinosorb, MaryanMorel, Masafumi Oyamada, Mathieu Blondel, Matt Krump, Matti Lyra, Maxim Kolganov, mbillinger, mhg, Michael Heilman, Michael Patterson, Miroslav Batchkarov, Nelle Varoquaux, Nicolas, Nikolay Mayorov, Olivier Grisel, Omer Katz, Óscar Nájera, Pauli Virtanen, Peter Fischer, Peter Prettenhofer, Phil Roth, pianomania, Preston Parry, Raghav RV, Rob Zinkov, Robert Layton, Rohan Ramanath, Saket Choudhary, Sam Zhang, santi, saurabh.bansod, scls19fr, Sebastian Raschka, Sebastian Saeger, Shivan Sornarajah, SimonPL, sinhrks, Skipper Seabold, Sonny Hu, sseg, Stephen Hoover, Steven De Gryze, Steven Seguin, Theodore Vasiloudis, Thomas Unterthiner, Tiago Freitas Pereira, Tian Wang, Tim Head, Timothy Hopper, tokoroten, Tom Dupré la Tour, Trevor Stephens, Valentin Stolbunov, Vighnesh Birodkar, Vinayak Mehta, Vincent, Vincent Michel, vstolbunov, wangz10, Wei Xue, Yucheng Low, Yury Zhauniarovich, Zac Stewart, zhai_pro, Zichen Wang