fetch_olivetti_faces#
- sklearn.datasets.fetch_olivetti_faces(*, data_home=None, shuffle=False, random_state=0, download_if_missing=True, return_X_y=False, n_retries=3, delay=1.0)[source]#
从 AT&T 加载 Olivetti 人脸数据集(分类)。
如有必要则下载。
类别
40
样本总数
400
维度
4096
特征
实数,介于 0 和 1 之间
在用户指南中了解更多信息。
- 参数:
- data_homestr 或 path-like, default=None
为数据集指定另一个下载和缓存文件夹。默认情况下,所有 scikit-learn 数据都存储在“~/scikit_learn_data”子文件夹中。
- shufflebool, default=False
如果为 True,数据集的顺序会被打乱,以避免同一人的图像被分组。
- random_stateint, RandomState 实例或 None, default=0
确定数据集洗牌的随机数生成。传入一个 int 以在多次函数调用中获得可重现的输出。请参阅词汇表。
- download_if_missingbool, default=True
如果为 False,则在数据在本地不可用时抛出 OSError,而不是尝试从源站点下载数据。
- return_X_ybool, default=False
如果为 True,返回
(data, target)
而不是Bunch
对象。有关data
和target
对象的更多信息,请参见下文。0.22 版本新增。
- n_retriesint, default=3
遇到 HTTP 错误时的重试次数。
1.5 版本新增。
- delayfloat, default=1.0
重试之间的秒数。
1.5 版本新增。
- 返回:
- data
Bunch
字典型对象,具有以下属性。
- data: ndarray, shape (400, 4096)
每行对应一个展平的原始尺寸 64 x 64 像素的人脸图像。
- imagesndarray, shape (400, 64, 64)
每行是一个人脸图像,对应数据集中的 40 个主体之一。
- targetndarray, shape (400,)
与每个人脸图像相关的标签。这些标签范围从 0-39,对应主体 ID。
- DESCRstr
Olivetti 人脸数据集修改版的描述。
- (data, target)如果
return_X_y=True
则为元组 包含上述
data
和target
对象的元组。0.22 版本新增。
- data
示例
>>> from sklearn.datasets import fetch_olivetti_faces >>> olivetti_faces = fetch_olivetti_faces() >>> olivetti_faces.data.shape (400, 4096) >>> olivetti_faces.target.shape (400,) >>> olivetti_faces.images.shape (400, 64, 64)