正交匹配追踪#
- sklearn.linear_model.orthogonal_mp(X, y, *, n_nonzero_coefs=None, tol=None, precompute=False, copy_X=True, return_path=False, return_n_iter=False)[source]#
- 正交匹配追踪 (OMP)。 - 求解 n_targets 个正交匹配追踪问题。问题的形式为: - 当使用 - n_nonzero_coefs参数化非零系数的数量时:argmin ||y - Xgamma||^2 受限于 ||gamma||_0 <= n_{nonzero coefs}- 当使用 - tol参数化误差时:argmin ||gamma||_0 受限于 ||y - Xgamma||^2 <= tol- 更多信息请阅读 用户指南。 - 参数:
- Xarray-like of shape (n_samples, n_features)
- 输入数据。假设列具有单位范数。 
- y形状为 (n_samples,) 或 (n_samples, n_targets) 的ndarray
- 输入目标。 
- n_nonzero_coefsint,默认值=None
- 解中非零项的期望数量。如果为 None(默认值),则此值设置为特征数的 10%。 
- tolfloat,默认值=None
- 残差的最大平方范数。如果非 None,则覆盖 n_nonzero_coefs。 
- precompute‘auto’ 或 bool,默认值=False
- 是否执行预计算。当 n_targets 或 n_samples 非常大时,可以提高性能。 
- copy_Xbool,默认值=True
- 算法是否必须复制设计矩阵 X。仅当 X 已经是 Fortran 顺序时,False 值才有帮助,否则无论如何都会创建副本。 
- return_pathbool,默认值=False
- 是否返回正向路径中非零系数的每个值。对于交叉验证很有用。 
- return_n_iterbool,默认值=False
- 是否返回迭代次数。 
 
- 返回:
- coef形状为 (n_features,) 或 (n_features, n_targets) 的ndarray
- OMP 解的系数。如果 - return_path=True,则包含整个系数路径。在这种情况下,其形状为 (n_features, n_features) 或 (n_features, n_targets, n_features),并且遍历最后一个轴会生成按活动特征的递增顺序排列的系数。
- n_iters类数组或 int
- 每个目标的活动特征数。仅当 - return_n_iter设置为 True 时返回。
 
 - 另请参见 - OrthogonalMatchingPursuit
- 正交匹配追踪模型。 
- orthogonal_mp_gram
- 使用 Gram 矩阵和乘积 X.T * y 求解 OMP 问题。 
- lars_path
- 使用 LARS 算法计算最小角回归或 Lasso 路径。 
- sklearn.decomposition.sparse_encode
- 稀疏编码。 
 - 备注 - 正交匹配追踪在 S. Mallat, Z. Zhang, Matching pursuits with time-frequency dictionaries, IEEE Transactions on Signal Processing, Vol. 41, No. 12. (December 1993), pp. 3397-3415 中介绍。 (https://www.di.ens.fr/~mallat/papiers/MallatPursuit93.pdf) - 此实现基于 Rubinstein, R., Zibulevsky, M. and Elad, M., Efficient Implementation of the K-SVD Algorithm using Batch Orthogonal Matching Pursuit Technical Report - CS Technion, April 2008. https://www.cs.technion.ac.il/~ronrubin/Publications/KSVD-OMP-v2.pdf - 示例 - >>> from sklearn.datasets import make_regression >>> from sklearn.linear_model import orthogonal_mp >>> X, y = make_regression(noise=4, random_state=0) >>> coef = orthogonal_mp(X, y) >>> coef.shape (100,) >>> X[:1,] @ coef array([-78.68...]) 
