fetch_olivetti_faces#
- sklearn.datasets.fetch_olivetti_faces(*, data_home=None, shuffle=False, random_state=0, download_if_missing=True, return_X_y=False, n_retries=3, delay=1.0)[source]#
- 从 AT&T 加载 Olivetti 人脸数据集(分类)。 - 如有必要则下载。 - 类别 - 40 - 样本总数 - 400 - 维度 - 4096 - 特征 - 实数,介于 0 和 1 之间 - 在用户指南中了解更多信息。 - 参数:
- data_homestr 或 path-like, default=None
- 为数据集指定另一个下载和缓存文件夹。默认情况下,所有 scikit-learn 数据都存储在“~/scikit_learn_data”子文件夹中。 
- shufflebool, default=False
- 如果为 True,数据集的顺序会被打乱,以避免同一人的图像被分组。 
- random_stateint, RandomState 实例或 None, default=0
- 确定数据集洗牌的随机数生成。传入一个 int 以在多次函数调用中获得可重现的输出。请参阅词汇表。 
- download_if_missingbool, default=True
- 如果为 False,则在数据在本地不可用时抛出 OSError,而不是尝试从源站点下载数据。 
- return_X_ybool, default=False
- 如果为 True,返回 - (data, target)而不是- Bunch对象。有关- data和- target对象的更多信息,请参见下文。- 0.22 版本新增。 
- n_retriesint, default=3
- 遇到 HTTP 错误时的重试次数。 - 1.5 版本新增。 
- delayfloat, default=1.0
- 重试之间的秒数。 - 1.5 版本新增。 
 
- 返回:
- dataBunch
- 字典型对象,具有以下属性。 - data: ndarray, shape (400, 4096)
- 每行对应一个展平的原始尺寸 64 x 64 像素的人脸图像。 
- imagesndarray, shape (400, 64, 64)
- 每行是一个人脸图像,对应数据集中的 40 个主体之一。 
- targetndarray, shape (400,)
- 与每个人脸图像相关的标签。这些标签范围从 0-39,对应主体 ID。 
- DESCRstr
- Olivetti 人脸数据集修改版的描述。 
 
- (data, target)如果 return_X_y=True则为元组
- 包含上述 - data和- target对象的元组。- 0.22 版本新增。 
 
- data
 - 示例 - >>> from sklearn.datasets import fetch_olivetti_faces >>> olivetti_faces = fetch_olivetti_faces() >>> olivetti_faces.data.shape (400, 4096) >>> olivetti_faces.target.shape (400,) >>> olivetti_faces.images.shape (400, 64, 64) 
 
     
 
