获取数据路径#
- sklearn.datasets.get_data_home(data_home=None) str [source]#
返回 scikit-learn 数据目录的路径。
一些大型数据集加载器使用此文件夹来避免多次下载数据。
默认情况下,数据目录设置为用户主文件夹中名为“scikit_learn_data”的文件夹。
或者,可以通过“SCIKIT_LEARN_DATA”环境变量或通过提供显式文件夹路径以编程方式设置。 “~”符号将扩展到用户主文件夹。
如果文件夹尚不存在,则会自动创建它。
- 参数:
- data_homestr 或路径类型,默认为 None
scikit-learn 数据目录的路径。如果为
None
,则默认路径为~/scikit_learn_data
。
- 返回值:
- data_home: str
scikit-learn 数据目录的路径。
示例
>>> import os >>> from sklearn.datasets import get_data_home >>> data_home_path = get_data_home() >>> os.path.exists(data_home_path) True
示例库#
文本文档的 Out-of-core 分类