fetch_species_distributions#
- sklearn.datasets.fetch_species_distributions(*, data_home=None, download_if_missing=True, n_retries=3, delay=1.0)[source]#
加载 Phillips et. al. (2006) 提供的物种分布数据集。
在用户指南中阅读更多内容。
- 参数:
- data_homestr or path-like, default=None
为数据集指定另一个下载和缓存文件夹。默认情况下,所有 scikit-learn 数据都存储在 ‘~/scikit_learn_data’ 子文件夹中。
- download_if_missingbool, default=True
If False, raise an OSError if the data is not locally available instead of trying to download the data from the source site.
- n_retriesint, default=3
Number of retries when HTTP errors are encountered.
1.5 版本新增。
- delayfloat, default=1.0
Number of seconds between retries.
1.5 版本新增。
- 返回:
- data
Bunch Dictionary-like object, with the following attributes.
- coveragesarray, shape = [14, 1592, 1212]
这些表示在地图网格的每个点测量的 14 个特征。下面讨论网格的经度/纬度值。缺失数据用值 -9999 表示。
- trainrecord array, shape = (1624,)
数据训练点。每个点有三个字段
train[‘species’] 是物种名称
train[‘dd long’] 是经度,以度为单位
train[‘dd lat’] 是纬度,以度为单位
- testrecord array, shape = (620,)
数据测试点。格式与训练数据相同。
- Nx, Nyintegers
网格中的经度 (x) 和纬度 (y) 数量
- x_left_lower_corner, y_left_lower_cornerfloats
左下角的 (x,y) 位置,以度为单位
- grid_sizefloat
网格点之间的间距,以度为单位
- data
注意事项
此数据集表示物种的地理分布。该数据集由 Phillips et. al. (2006) 提供。
这两种物种是
“Bradypus variegatus”,褐喉三趾树懒。
“Microryzomys minutus”,也称为森林小稻鼠,一种生活在秘鲁、哥伦比亚、厄瓜多尔、秘鲁和委内瑞拉的啮齿动物。
References
“Maximum entropy modeling of species geographic distributions” S. J. Phillips, R. P. Anderson, R. E. Schapire - Ecological Modelling, 190:231-259, 2006.
示例
>>> from sklearn.datasets import fetch_species_distributions >>> species = fetch_species_distributions() >>> species.train[:5] array([(b'microryzomys_minutus', -64.7 , -17.85 ), (b'microryzomys_minutus', -67.8333, -16.3333), (b'microryzomys_minutus', -67.8833, -16.3 ), (b'microryzomys_minutus', -67.8 , -16.2667), (b'microryzomys_minutus', -67.9833, -15.9 )], dtype=[('species', 'S22'), ('dd long', '<f4'), ('dd lat', '<f4')])
有关更详细的示例,请参阅物种分布建模