davies_bouldin_score#

sklearn.metrics.davies_bouldin_score(X, labels)[source]#

计算戴维森-布丁指数。

该分数定义为每个聚类与其最相似聚类的平均相似度度量,其中相似度是聚类内距离与聚类间距离的比率。因此,聚类之间距离越远、分散性越小,得分越好。

最低分数为零,数值越低表示聚类效果越好。

详情请参阅用户指南

0.20 版本新增。

参数:
X形状为 (n_samples, n_features) 的类数组

一个包含 n_features 维数据点的列表。每行对应一个数据点。

labels形状为 (n_samples,) 的类数组

每个样本的预测标签。

返回:
score: 浮点数

计算得到的戴维森-布丁指数。

参考文献

[1]

Davies, David L.; Bouldin, Donald W. (1979). “一种聚类分离度量”. IEEE Transactions on Pattern Analysis and Machine Intelligence. PAMI-1 (2): 224-227

示例

>>> from sklearn.metrics import davies_bouldin_score
>>> X = [[0, 1], [1, 1], [3, 4]]
>>> labels = [0, 0, 1]
>>> davies_bouldin_score(X, labels)
0.12...