cosine_similarity#
- sklearn.metrics.pairwise.cosine_similarity(X, Y=None, dense_output=True)[source]#
计算 X 和 Y 中样本间的余弦相似度。
余弦相似度(或余弦核)将相似度计算为 X 和 Y 的归一化点积。
K(X, Y) = <X, Y> / (||X||*||Y||)
在 L2 范数归一化数据上,此函数等同于 linear_kernel。
欲了解更多信息,请参阅用户指南。
- 参数:
- X{类数组, 稀疏矩阵},形状为 (n_samples_X, n_features)
输入数据。
- Y{类数组, 稀疏矩阵},形状为 (n_samples_Y, n_features),默认为 None
输入数据。如果为
None
,输出将是X
中所有样本之间的成对相似度。- dense_output布尔值,默认为 True
即使输入是稀疏的,是否返回密集输出。如果为
False
,则当两个输入数组都是稀疏时,输出也是稀疏的。0.17 版本新增:参数
dense_output
用于密集输出。
- 返回:
- similaritiesndarray 或稀疏矩阵,形状为 (n_samples_X, n_samples_Y)
返回 X 和 Y 中样本间的余弦相似度。
示例
>>> from sklearn.metrics.pairwise import cosine_similarity >>> X = [[0, 0, 0], [1, 1, 1]] >>> Y = [[1, 0, 0], [1, 1, 0]] >>> cosine_similarity(X, Y) array([[0. , 0. ], [0.577, 0.816]])