sklearn.datasets#
用于加载常用数据集和人工数据生成器的实用工具。
用户指南。有关更多详细信息,请参阅数据集加载工具部分。
加载器#
删除数据主目录缓存中的所有内容。 |
|
以svmlight / libsvm文件格式转储数据集。 |
|
从20个新闻组数据集加载文件名和数据(分类)。 |
|
加载并向量化20个新闻组数据集(分类)。 |
|
加载加州住房数据集(回归)。 |
|
加载森林覆盖类型数据集(分类)。 |
|
如果本地文件夹中不存在,则从网络获取文件。 |
|
加载kddcup99数据集(分类)。 |
|
加载野外标记人脸(LFW)对数据集(分类)。 |
|
加载野外标记人脸(LFW)人物数据集(分类)。 |
|
从AT&T加载Olivetti人脸数据集(分类)。 |
|
通过名称或数据集ID从openml获取数据集。 |
|
加载RCV1多标签数据集(分类)。 |
|
用于加载Phillips等人提供的物种分布数据集。 |
|
返回scikit-learn数据目录的路径。 |
|
加载并返回威斯康星乳腺癌数据集(分类)。 |
|
加载并返回糖尿病数据集(回归)。 |
|
加载并返回数字数据集(分类)。 |
|
加载以子文件夹名称作为类别的文本文件。 |
|
加载并返回鸢尾花数据集(分类)。 |
|
加载并返回Linnerud体育锻炼数据集。 |
|
加载单个样本图像的numpy数组。 |
|
加载用于图像操作的样本图像。 |
|
以svmlight / libsvm格式加载数据集到稀疏CSR矩阵。 |
|
从多个SVMlight格式文件中加载数据集。 |
|
加载并返回葡萄酒数据集(分类)。 |
样本生成器#
生成用于双聚类的常数块对角结构数组。 |
|
生成用于聚类的各向同性高斯斑点。 |
|
生成用于双聚类的块棋盘格结构数组。 |
|
在2D空间中生成一个包含小圆的大圆。 |
|
生成一个随机的n类分类问题。 |
|
生成“Friedman #1”回归问题。 |
|
生成“Friedman #2”回归问题。 |
|
生成“Friedman #3”回归问题。 |
|
生成各向同性高斯并按分位数标记样本。 |
|
生成Hastie等人在2009年《统计学习基础》中例10.2使用的二元分类数据。 |
|
生成一个以钟形奇异值为主的低秩矩阵。 |
|
生成两个交错的半圆。 |
|
生成一个随机的多标签分类问题。 |
|
生成一个随机回归问题。 |
|
生成一个S曲线数据集。 |
|
将信号生成为字典元素的稀疏组合。 |
|
生成一个稀疏对称正定矩阵。 |
|
生成一个具有稀疏不相关设计的随机回归问题。 |
|
生成一个随机对称正定矩阵。 |
|
生成一个瑞士卷数据集。 |