马特恩核函数#

class sklearn.gaussian_process.kernels.Matern(length_scale=1.0, length_scale_bounds=(1e-05, 100000.0), nu=1.5)[source]#

Matern 核函数。

Matern 核函数类是对 RBF 的推广。它有一个额外的参数 \(\nu\) 用于控制结果函数的平滑度。 \(\nu\) 越小,逼近函数越不平滑。当 \(\nu\rightarrow\infty\) 时,该核函数等价于 RBF 核函数。当 \(\nu = 1/2\) 时,Matern 核函数与绝对指数核函数相同。重要的中间值是 \(\nu=1.5\)(一阶可微函数)和 \(\nu=2.5\)(二阶可微函数)。

该核函数由下式给出:

\[k(x_i, x_j) = \frac{1}{\Gamma(\nu)2^{\nu-1}}\Bigg( \frac{\sqrt{2\nu}}{l} d(x_i , x_j ) \Bigg)^\nu K_\nu\Bigg( \frac{\sqrt{2\nu}}{l} d(x_i , x_j )\Bigg)\]

其中 \(d(\cdot,\cdot)\) 是欧几里得距离,\(K_{\nu}(\cdot)\) 是修正的贝塞尔函数,\(\Gamma(\cdot)\) 是伽马函数。有关 Matern 核函数的不同变体的详细信息,请参见 [1],第 4 章,第 4.2 节。

用户指南 中了解更多信息。

0.18 版本中添加。

参数:
length_scale浮点数或形状为 (n_features,) 的 ndarray,默认为 1.0

核函数的长度尺度。如果为浮点数,则使用各向同性核函数;如果为数组,则使用各向异性核函数,其中 l 的每个维度定义相应特征维度的长度尺度。

length_scale_bounds一对浮点数 >= 0 或 “fixed”,默认为 (1e-5, 1e5)

“length_scale” 的下界和上界。如果设置为“fixed”,则在超参数调整期间无法更改“length_scale”。

nu浮点数,默认为 1.5

控制学习函数平滑度的参数 nu。nu 越小,逼近函数越不平滑。对于 nu=inf,核函数等价于 RBF 核函数;对于 nu=0.5,等价于绝对指数核函数。重要的中间值是 nu=1.5(一阶可微函数)和 nu=2.5(二阶可微函数)。请注意,nu 的值不在 [0.5, 1.5, 2.5, inf] 中会带来更高的计算成本(大约高 10 倍),因为它们需要计算修正的贝塞尔函数。此外,与 l 不同的是,nu 保持其初始值不变,不会被优化。

参考文献

示例

>>> from sklearn.datasets import load_iris
>>> from sklearn.gaussian_process import GaussianProcessClassifier
>>> from sklearn.gaussian_process.kernels import Matern
>>> X, y = load_iris(return_X_y=True)
>>> kernel = 1.0 * Matern(length_scale=1.0, nu=1.5)
>>> gpc = GaussianProcessClassifier(kernel=kernel,
...         random_state=0).fit(X, y)
>>> gpc.score(X, y)
0.9866...
>>> gpc.predict_proba(X[:2,:])
array([[0.8513..., 0.0368..., 0.1117...],
        [0.8086..., 0.0693..., 0.1220...]])
__call__(X, Y=None, eval_gradient=False)[source]#

返回核函数 k(X, Y) 及其梯度(可选)。

参数:
X形状为 (n_samples_X, n_features) 的 ndarray

返回的核函数 k(X, Y) 的左参数

Y形状为 (n_samples_Y, n_features) 的 ndarray,默认为 None

返回的核函数 k(X, Y) 的右参数。如果为 None,则计算 k(X, X)。

eval_gradient布尔值,默认为 False

确定是否计算关于核超参数对数的梯度。仅当 Y 为 None 时才支持。

返回:
K形状为 (n_samples_X, n_samples_Y) 的 ndarray

核函数 k(X, Y)

K_gradient形状为 (n_samples_X, n_samples_X, n_dims) 的 ndarray,可选

核函数 k(X, X) 关于核超参数对数的梯度。仅当 eval_gradient 为 True 时返回。

property bounds#

返回 theta 的对数变换边界。

返回:
bounds形状为 (n_dims, 2) 的 ndarray

核函数超参数 theta 的对数变换边界

clone_with_theta(theta)[source]#

返回具有给定超参数 theta 的 self 的克隆。

参数:
theta形状为 (n_dims,) 的 ndarray

超参数

diag(X)[source]#

返回核函数 k(X, X) 的对角线。

此方法的结果与 np.diag(self(X)) 相同;但是,由于仅计算对角线,因此可以更高效地计算。

参数:
X形状为 (n_samples_X, n_features) 的 ndarray

返回的核函数 k(X, Y) 的左参数

返回:
K_diag形状为 (n_samples_X,) 的 ndarray

核函数 k(X, X) 的对角线

get_params(deep=True)[source]#

获取此核函数的参数。

参数:
deep布尔值,默认为 True

如果为 True,则将返回此估计器的参数以及作为估计器的包含子对象的参数。

返回:
params字典

参数名称与其值的映射。

属性 超参数#

返回所有超参数规范的列表。

是否平稳()[源代码]#

返回内核是否平稳。

属性 维度数#

返回内核的非固定超参数数量。

属性 是否需要向量输入#

返回内核是定义在固定长度特征向量上还是通用对象上。为向后兼容性,默认为 True。

设置参数(**参数)[源代码]#

设置此内核的参数。

此方法适用于简单内核以及嵌套内核。后者具有 <组件>__<参数> 形式的参数,因此可以更新嵌套对象的每个组件。

返回:
自身
属性 theta#

返回(扁平化的,对数转换的)非固定超参数。

请注意,theta 通常是内核超参数的对数转换值,因为这种搜索空间表示更适合超参数搜索,因为像长度尺度这样的超参数自然存在于对数尺度上。

返回:
theta形状为 (n_dims,) 的 ndarray

内核的非固定、对数转换的超参数