calinski_harabasz_score#

sklearn.metrics.calinski_harabasz_score(X, labels)[source]#

计算 Calinski and Harabasz 分数。

它也被称为方差比准则(Variance Ratio Criterion)。

该分数定义为簇间离散度之和与簇内离散度之和的比率。

用户指南中阅读更多内容。

参数:
Xshape 为 (n_samples, n_features) 的 array-like

一个由n_features维数据点组成的列表。每行对应一个数据点。

labels形状为 (n_samples,) 的类数组

每个样本的预测标签。

返回:
scorefloat

计算出的 Calinski-Harabasz 分数。

References

示例

>>> from sklearn.datasets import make_blobs
>>> from sklearn.cluster import KMeans
>>> from sklearn.metrics import calinski_harabasz_score
>>> X, _ = make_blobs(random_state=0)
>>> kmeans = KMeans(n_clusters=3, random_state=0,).fit(X)
>>> calinski_harabasz_score(X, kmeans.labels_)
114.8...