fetch_olivetti_faces#

sklearn.datasets.fetch_olivetti_faces(*, data_home=None, shuffle=False, random_state=0, download_if_missing=True, return_X_y=False, n_retries=3, delay=1.0)[source]#

从 AT&T 加载 Olivetti 人脸数据集(分类)。

如有必要则下载。

类别

40

样本总数

400

维度

4096

特征

实数,介于 0 和 1 之间

用户指南中了解更多信息。

参数:
data_homestr 或 path-like, default=None

为数据集指定另一个下载和缓存文件夹。默认情况下,所有 scikit-learn 数据都存储在“~/scikit_learn_data”子文件夹中。

shufflebool, default=False

如果为 True,数据集的顺序会被打乱,以避免同一人的图像被分组。

random_stateint, RandomState 实例或 None, default=0

确定数据集洗牌的随机数生成。传入一个 int 以在多次函数调用中获得可重现的输出。请参阅词汇表

download_if_missingbool, default=True

如果为 False,则在数据在本地不可用时抛出 OSError,而不是尝试从源站点下载数据。

return_X_ybool, default=False

如果为 True,返回 (data, target) 而不是 Bunch 对象。有关 datatarget 对象的更多信息,请参见下文。

0.22 版本新增。

n_retriesint, default=3

遇到 HTTP 错误时的重试次数。

1.5 版本新增。

delayfloat, default=1.0

重试之间的秒数。

1.5 版本新增。

返回:
dataBunch

字典型对象,具有以下属性。

data: ndarray, shape (400, 4096)

每行对应一个展平的原始尺寸 64 x 64 像素的人脸图像。

imagesndarray, shape (400, 64, 64)

每行是一个人脸图像,对应数据集中的 40 个主体之一。

targetndarray, shape (400,)

与每个人脸图像相关的标签。这些标签范围从 0-39,对应主体 ID。

DESCRstr

Olivetti 人脸数据集修改版的描述。

(data, target)如果 return_X_y=True 则为元组

包含上述 datatarget 对象的元组。

0.22 版本新增。

示例

>>> from sklearn.datasets import fetch_olivetti_faces
>>> olivetti_faces = fetch_olivetti_faces()
>>> olivetti_faces.data.shape
(400, 4096)
>>> olivetti_faces.target.shape
(400,)
>>> olivetti_faces.images.shape
(400, 64, 64)