sklearn.datasets#
加载常用数据集和生成人工数据的工具。
用户指南。更多详情请参见数据集加载工具部分。
加载器#
删除数据缓存目录中的所有内容。 |
|
将数据集以 svmlight/libsvm 文件格式转储。 |
|
加载 20 个新闻组数据集(分类)的文件名和数据。 |
|
加载并向量化 20 个新闻组数据集(分类)。 |
|
加载加州房价数据集(回归)。 |
|
加载 covertype 数据集(分类)。 |
|
如果本地文件夹中不存在,则从网络获取文件。 |
|
加载 kddcup99 数据集(分类)。 |
|
加载 Labeled Faces in the Wild (LFW) pairs 数据集(分类)。 |
|
加载 Labeled Faces in the Wild (LFW) people 数据集(分类)。 |
|
加载来自 AT&T 的 Olivetti 人脸数据集(分类)。 |
|
按名称或数据集 ID 从 openml 获取数据集。 |
|
加载 RCV1 多标签数据集(分类)。 |
|
加载 Phillips 等人提出的物种分布数据集。 |
|
返回 scikit-learn 数据目录的路径。 |
|
加载并返回威斯康星州乳腺癌数据集(分类)。 |
|
加载并返回糖尿病数据集(回归)。 |
|
加载并返回数字数据集(分类)。 |
|
加载类别作为子文件夹名称的文本文件。 |
|
加载并返回鸢尾花数据集(分类)。 |
|
加载并返回 Linnerud 体育锻炼数据集。 |
|
加载单个样本图像的 NumPy 数组。 |
|
加载用于图像处理的样本图像。 |
|
将 svmlight/libsvm 格式的数据集加载到稀疏 CSR 矩阵中。 |
|
从多个 SVMlight 格式的文件中加载数据集。 |
|
加载并返回葡萄酒数据集(分类)。 |
样本生成器#
为双聚类生成一个常数块对角结构数组。 |
|
为聚类生成各向同性高斯混合数据。 |
|
为双聚类生成具有块棋盘结构的数组。 |
|
在二维空间中创建一个包含较小圆的大圆。 |
|
生成一个随机的n类分类问题。 |
|
生成“Friedman #1”回归问题。 |
|
生成“Friedman #2”回归问题。 |
|
生成“Friedman #3”回归问题。 |
|
生成各向同性高斯数据并根据分位数标记样本。 |
|
生成Hastie等人2009年例10.2中使用的二元分类数据。 |
|
生成一个大部分低秩矩阵,其奇异值呈钟形分布。 |
|
创建两个交错的半圆。 |
|
生成一个随机的多标签分类问题。 |
|
生成一个随机回归问题。 |
|
生成一个S曲线数据集。 |
|
生成一个作为字典元素稀疏组合的信号。 |
|
生成一个稀疏对称正定矩阵。 |
|
生成一个具有稀疏不相关设计的随机回归问题。 |
|
生成一个随机的对称正定矩阵。 |
|
生成一个瑞士卷数据集。 |