fetch_lfw_people#
- sklearn.datasets.fetch_lfw_people(*, data_home=None, funneled=True, resize=0.5, min_faces_per_person=0, color=False, slice_=(slice(70, 195, None), slice(78, 172, None)), download_if_missing=True, return_X_y=False, n_retries=3, delay=1.0)[源代码]#
加载野外标记人脸 (LFW) 人员数据集(分类)。
如有必要,下载。
类别
5749
样本总数
13233
维度
5828
特征
实数,介于 0 和 255 之间
有关此数据集的使用示例,请参阅使用特征脸和 SVMs 的人脸识别示例。
在用户指南中了解更多信息。
- 参数:
- data_home字符串或路径类,默认值=None
为数据集指定另一个下载和缓存文件夹。默认情况下,所有 scikit-learn 数据都存储在“~/scikit_learn_data”子文件夹中。
- funneled布尔值,默认值=True
下载并使用数据集的漏斗状变体。
- resize浮点数或None,默认值=0.5
用于调整每张人脸图片大小的比例。如果为
None
,则不执行调整大小。- min_faces_per_person整数,默认值=None
提取的数据集将只保留至少有
min_faces_per_person
张不同图片的人的照片。- color布尔值,默认值=False
保留 3 个 RGB 通道,而不是将其平均为一个灰度通道。如果 color 为 True,则数据的形状比 color = False 时的形状多一个维度。
- slice_切片元组,默认值=(slice(70, 195), slice(78, 172))
提供自定义的 2D 切片(高度、宽度)以提取 jpeg 文件的“有趣”部分,并避免使用来自背景的统计相关性。
- download_if_missing布尔值,默认值=True
如果为 False,则在数据在本地不可用时引发 OSError,而不是尝试从源网站下载数据。
- return_X_y布尔值,默认值=False
如果为 True,则返回
(dataset.data, dataset.target)
而不是 Bunch 对象。有关dataset.data
和dataset.target
对象的更多信息,请参阅下文。版本 0.20 中新增。
- n_retries整数,默认值=3
遇到 HTTP 错误时的重试次数。
版本 1.5 中新增。
- delay浮点数,默认值=1.0
重试之间的秒数。
版本 1.5 中新增。
- 返回:
- dataset
Bunch
字典状对象,具有以下属性。
- data形状为 (13233, 2914) 的 numpy 数组
每行对应于原始大小为 62 x 47 像素的展开人脸图像。更改
slice_
或 resize 参数将改变输出的形状。- images形状为 (13233, 62, 47) 的 numpy 数组
每行是一个人脸图像,对应于数据集中的 5749 个人之一。更改
slice_
或 resize 参数将改变输出的形状。- target形状为 (13233,) 的 numpy 数组
与每张人脸图像关联的标签。这些标签范围从 0-5748,对应于人员 ID。
- target_names形状为 (5749,) 的 numpy 数组
数据集中所有人员的姓名。数组中的位置对应于目标数组中的人员 ID。
- DESCR字符串
野外标记人脸 (LFW) 数据集的描述。
- (data, target)如果
return_X_y
为 True,则为元组 包含两个 ndarray 的元组。第一个包含一个形状为 (n_samples, n_features) 的 2D 数组,每行表示一个样本,每列表示特征。第二个是形状为 (n_samples,) 的 ndarray,包含目标样本。
版本 0.20 中新增。
- dataset
示例
>>> from sklearn.datasets import fetch_lfw_people >>> lfw_people = fetch_lfw_people() >>> lfw_people.data.shape (13233, 2914) >>> lfw_people.target.shape (13233,) >>> for name in lfw_people.target_names[:5]: ... print(name) AJ Cook AJ Lamas Aaron Eckhart Aaron Guiel Aaron Patterson