获取物种分布数据#
- sklearn.datasets.fetch_species_distributions(*, data_home=None, download_if_missing=True, n_retries=3, delay=1.0)[source]#
用于从Phillips等人(2006)处加载物种分布数据集的加载器。
更多信息请参见用户指南。
- 参数:
- data_homestr 或路径类型,默认为None
指定数据集的另一个下载和缓存文件夹。默认情况下,所有scikit-learn数据都存储在‘~/scikit_learn_data’子文件夹中。
- download_if_missingbool,默认为True
如果为False,则如果数据在本地不可用,则会引发OSError异常,而不是尝试从源站点下载数据。
- n_retriesint,默认为3
遇到HTTP错误时的重试次数。
版本1.5中添加。
- delayfloat,默认为1.0
两次重试之间的时间间隔(秒)。
版本1.5中添加。
- 返回:
- 数据
Bunch
类似字典的对象,具有以下属性。
- coverages数组,形状 = [14, 1592, 1212]
这些代表在地图网格的每个点测量的14个特征。网格的经纬度值将在下面讨论。缺失数据用值-9999表示。
- train记录数组,形状 = (1624,)
数据的训练点。每个点具有三个字段
train[‘species’] 是物种名称
train[‘dd long’] 是经度,单位为度
train[‘dd lat’] 是纬度,单位为度
- test记录数组,形状 = (620,)
数据的测试点。格式与训练数据相同。
- Nx, Ny整数
网格中经度 (x) 和纬度 (y) 的数量
- x_left_lower_corner, y_left_lower_corner浮点数
左下角的 (x,y) 位置,单位为度
- grid_size浮点数
网格点之间的间距,单位为度
- 数据
备注
此数据集表示物种的地理分布。该数据集由 Phillips 等人 (2006) 提供。
这两种物种是
“Bradypus variegatus”,即三趾树懒。
“Microryzomys minutus”,也称为森林小型稻鼠,一种生活在秘鲁、哥伦比亚、厄瓜多尔、秘鲁和委内瑞拉的啮齿动物。
参考文献
“物种地理分布的最大熵模型” S. J. Phillips, R. P. Anderson, R. E. Schapire - 生态建模,190:231-259, 2006。
示例
>>> from sklearn.datasets import fetch_species_distributions >>> species = fetch_species_distributions() >>> species.train[:5] array([(b'microryzomys_minutus', -64.7 , -17.85 ), (b'microryzomys_minutus', -67.8333, -16.3333), (b'microryzomys_minutus', -67.8833, -16.3 ), (b'microryzomys_minutus', -67.8 , -16.2667), (b'microryzomys_minutus', -67.9833, -15.9 )], dtype=[('species', 'S22'), ('dd long', '<f4'), ('dd lat', '<f4')])
有关更详尽的示例,请参见 物种分布建模
图库示例#
物种分布建模
物种分布的核密度估计