cosine_similarity#
- sklearn.metrics.pairwise.cosine_similarity(X, Y=None, dense_output=True)[源]#
计算 X 和 Y 中的样本之间的余弦相似度。
余弦相似度,或余弦核,将相似度计算为 X 和 Y 的归一化点积
K(X, Y) = <X, Y> / (||X||*||Y||)
在 L2 归一化数据上,此函数等效于 linear_kernel。
在用户指南中阅读更多内容。
- 参数:
- X{array-like, sparse matrix} of shape (n_samples_X, n_features)
Input data.
- Y{array-like, sparse matrix} of shape (n_samples_Y, n_features), default=None
输入数据。如果为
None,则输出将是X中所有样本的成对相似度。- dense_outputbool, 默认值为 True
即使输入是稀疏的,是否也返回密集输出。如果为
False,则当两个输入数组都是稀疏时,输出是稀疏的。在版本 0.17 中新增: 用于密集输出的参数
dense_output。
- 返回:
- similarities形状为 (n_samples_X, n_samples_Y) 的 ndarray 或稀疏矩阵
返回 X 和 Y 中样本之间的余弦相似度。
示例
>>> from sklearn.metrics.pairwise import cosine_similarity >>> X = [[0, 0, 0], [1, 1, 1]] >>> Y = [[1, 0, 0], [1, 1, 0]] >>> cosine_similarity(X, Y) array([[0. , 0. ], [0.577, 0.816]])