load_wine#

sklearn.datasets.load_wine(*, return_X_y=False, as_frame=False)[源码]#

加载并返回葡萄酒数据集（分类）。

在 0.18 版本中新增。

葡萄酒数据集是一个经典且非常简单的多类别分类数据集。

类别数量	3
每类样本数	[59,71,48]
总样本数	178
特征维度	13
特征	实数，正值

UCI ML 葡萄酒数据集（Wine Data Set）的副本已从以下地址下载并修改为标准格式：https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data

详情请参阅用户指南。

参数:

return_X_y布尔值，默认为 False: 如果为 True，则返回 (data, target) 而非 Bunch 对象。有关 data 和 target 对象的更多信息，请参阅下文。
as_frame布尔值，默认为 False: 如果为 True，数据将是一个 pandas DataFrame，包含具有适当数据类型（数值型）的列。目标将是一个 pandas DataFrame 或 Series，具体取决于目标列的数量。如果 return_X_y 为 True，则 (data, target) 将是如下所述的 pandas DataFrames 或 Series。

在 0.23 版本中新增。

返回:

dataBunch

类字典对象，具有以下属性。

data{ndarray, dataframe}，形状为 (178, 13): 数据矩阵。如果 as_frame=True，data 将是一个 pandas DataFrame。
target: {ndarray, Series}，形状为 (178,): 分类目标。如果 as_frame=True，target 将是一个 pandas Series。
feature_names: 列表: 数据集列的名称。
target_names: 列表: 目标类别的名称。
frame: DataFrame，形状为 (178, 14): 仅当 as_frame=True 时存在。包含 data 和 target 的 DataFrame。

在 0.23 版本中新增。
DESCR: 字符串: 数据集的完整描述。

(data, target)元组（如果 return_X_y 为 True）

默认情况下是一个包含两个 ndarray 的元组。第一个包含一个形状为 (178, 13) 的 2D 数组，其中每行代表一个样本，每列代表一个特征。第二个形状为 (178,) 的数组包含目标样本。

示例

假设您对样本 10、80 和 140 感兴趣，并想知道它们的类别名称。

>>> from sklearn.datasets import load_wine
>>> data = load_wine()
>>> data.target[[10, 80, 140]]
array([0, 1, 2])
>>> list(data.target_names)
[np.str_('class_0'), np.str_('class_1'), np.str_('class_2')]

示例图库#

真实数据集上的异常值检测

带可视化 API 的 ROC 曲线

特征缩放的重要性

load_wine#

示例图库#

此页面