sklearn.random_projection#
随机投影变换器。
随机投影是一种简单且计算效率高的方法,通过牺牲可控的精度(作为额外的方差)来换取更快的处理时间和更小的模型大小,从而降低数据的维度。
随机投影矩阵的维度和分布被控制,以保留数据集中任意两个样本之间的成对距离。
随机投影效率背后的主要理论结果是Johnson-Lindenstrauss 引理(引自维基百科)
在数学中,Johnson-Lindenstrauss 引理是一个关于将点从高维空间低失真嵌入到低维欧几里得空间的结果。该引理指出,高维空间中的一小组点可以嵌入到维度低得多的空间中,并且点之间的距离几乎保持不变。用于嵌入的映射至少是 Lipschitz 连续的,甚至可以被视为正交投影。
用户指南。 有关详细信息,请参阅随机投影部分。
通过高斯随机投影降低维度。 |
|
通过稀疏随机投影降低维度。 |
|
查找用于随机投影的“安全”组件数量。 |