fetch_olivetti_faces#

sklearn.datasets.fetch_olivetti_faces(*, data_home=None, shuffle=False, random_state=0, download_if_missing=True, return_X_y=False, n_retries=3, delay=1.0)[source]#

从 AT&T 加载 Olivetti 人脸数据集（分类）。

如有必要则下载。

类别	40
样本总数	400
维度	4096
特征	实数，介于 0 和 1 之间

在用户指南中了解更多信息。

参数:

data_homestr 或 path-like, default=None: 为数据集指定另一个下载和缓存文件夹。默认情况下，所有 scikit-learn 数据都存储在“~/scikit_learn_data”子文件夹中。
shufflebool, default=False: 如果为 True，数据集的顺序会被打乱，以避免同一人的图像被分组。
random_stateint, RandomState 实例或 None, default=0: 确定数据集洗牌的随机数生成。传入一个 int 以在多次函数调用中获得可重现的输出。请参阅词汇表。
download_if_missingbool, default=True: 如果为 False，则在数据在本地不可用时抛出 OSError，而不是尝试从源站点下载数据。
return_X_ybool, default=False: 如果为 True，返回 (data, target) 而不是 Bunch 对象。有关 data 和 target 对象的更多信息，请参见下文。

0.22 版本新增。
n_retriesint, default=3: 遇到 HTTP 错误时的重试次数。

1.5 版本新增。
delayfloat, default=1.0: 重试之间的秒数。

1.5 版本新增。

返回:

dataBunch

字典型对象，具有以下属性。

data: ndarray, shape (400, 4096): 每行对应一个展平的原始尺寸 64 x 64 像素的人脸图像。
imagesndarray, shape (400, 64, 64): 每行是一个人脸图像，对应数据集中的 40 个主体之一。
targetndarray, shape (400,): 与每个人脸图像相关的标签。这些标签范围从 0-39，对应主体 ID。
DESCRstr: Olivetti 人脸数据集修改版的描述。

(data, target)如果 return_X_y=True 则为元组

包含上述 data 和 target 对象的元组。

0.22 版本新增。

示例

>>> from sklearn.datasets import fetch_olivetti_faces
>>> olivetti_faces = fetch_olivetti_faces()
>>> olivetti_faces.data.shape
(400, 4096)
>>> olivetti_faces.target.shape
(400,)
>>> olivetti_faces.images.shape
(400, 64, 64)

图库示例#

人脸部件字典的在线学习

人脸数据集分解

使用多输出估计器完成人脸

fetch_olivetti_faces#

图库示例#

此页