ParameterSampler#

class sklearn.model_selection.ParameterSampler(param_distributions, n_iter, *, random_state=None)[source]#

从给定分布中抽样参数的生成器。

用于超参数搜索的随机候选组合的非确定性可迭代对象。如果所有参数都以列表形式呈现,则执行不重复抽样。如果至少一个参数以分布形式给出,则使用重复抽样。强烈建议对连续参数使用连续分布。

用户指南中阅读更多内容。

参数:
param_distributionsdict

字典,以参数名称(str)作为键,并包含要尝试的分布或参数列表。分布必须提供用于抽样的 rvs 方法(例如来自 scipy.stats.distributions 的方法)。如果给定一个列表,则进行均匀抽样。如果给定一个字典列表,则首先均匀抽样一个字典,然后使用该字典按上述方式抽样一个参数。

n_iterint

生成的参数设置数量。

random_stateint、RandomState 实例或 None,默认为 None

伪随机数生成器状态,用于从可能值的列表中进行随机均匀抽样,而不是从 scipy.stats 分布中抽样。传入一个 int 以便在多次函数调用中获得可重现的输出。请参阅词汇表

返回:
paramsstr 到任意类型的字典

生成将每个估计器参数映射到其抽样值的字典。

示例

>>> from sklearn.model_selection import ParameterSampler
>>> from scipy.stats.distributions import expon
>>> import numpy as np
>>> rng = np.random.RandomState(0)
>>> param_grid = {'a':[1, 2], 'b': expon()}
>>> param_list = list(ParameterSampler(param_grid, n_iter=4,
...                                    random_state=rng))
>>> rounded_list = [dict((k, round(v, 6)) for (k, v) in d.items())
...                 for d in param_list]
>>> rounded_list == [{'b': 0.89856, 'a': 1},
...                  {'b': 0.923223, 'a': 1},
...                  {'b': 1.878964, 'a': 2},
...                  {'b': 1.038159, 'a': 2}]
True