load_wine#
- sklearn.datasets.load_wine(*, return_X_y=False, as_frame=False)[源码]#
加载并返回葡萄酒数据集(分类)。
在 0.18 版本中新增。
葡萄酒数据集是一个经典且非常简单的多类别分类数据集。
类别数量
3
每类样本数
[59,71,48]
总样本数
178
特征维度
13
特征
实数,正值
UCI ML 葡萄酒数据集(Wine Data Set)的副本已从以下地址下载并修改为标准格式:https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data
详情请参阅用户指南。
- 参数:
- return_X_y布尔值,默认为 False
如果为 True,则返回
(data, target)
而非 Bunch 对象。有关data
和target
对象的更多信息,请参阅下文。- as_frame布尔值,默认为 False
如果为 True,数据将是一个 pandas DataFrame,包含具有适当数据类型(数值型)的列。目标将是一个 pandas DataFrame 或 Series,具体取决于目标列的数量。如果
return_X_y
为 True,则 (data
,target
) 将是如下所述的 pandas DataFrames 或 Series。在 0.23 版本中新增。
- 返回:
- data
Bunch
类字典对象,具有以下属性。
- data{ndarray, dataframe},形状为 (178, 13)
数据矩阵。如果
as_frame=True
,data
将是一个 pandas DataFrame。- target: {ndarray, Series},形状为 (178,)
分类目标。如果
as_frame=True
,target
将是一个 pandas Series。- feature_names: 列表
数据集列的名称。
- target_names: 列表
目标类别的名称。
- frame: DataFrame,形状为 (178, 14)
仅当
as_frame=True
时存在。包含data
和target
的 DataFrame。在 0.23 版本中新增。
- DESCR: 字符串
数据集的完整描述。
- (data, target)元组(如果
return_X_y
为 True) 默认情况下是一个包含两个 ndarray 的元组。第一个包含一个形状为 (178, 13) 的 2D 数组,其中每行代表一个样本,每列代表一个特征。第二个形状为 (178,) 的数组包含目标样本。
- data
示例
假设您对样本 10、80 和 140 感兴趣,并想知道它们的类别名称。
>>> from sklearn.datasets import load_wine >>> data = load_wine() >>> data.target[[10, 80, 140]] array([0, 1, 2]) >>> list(data.target_names) [np.str_('class_0'), np.str_('class_1'), np.str_('class_2')]