Calinski-Harabasz指数#

sklearn.metrics.calinski_harabasz_score(X, labels)[source]#

计算Calinski-Harabasz指数。

它也称为方差比率准则。

该指数定义为组间离散度之和与组内离散度之和的比率。

更多信息请参见用户指南

参数:
Xarray-like of shape (n_samples, n_features)

一个包含n_features维数据点的列表。每一行对应一个数据点。

labelsarray-like of shape (n_samples,)

每个样本的预测标签。

返回:
scorefloat

计算得到的Calinski-Harabasz指数。

参考文献

示例

>>> from sklearn.datasets import make_blobs
>>> from sklearn.cluster import KMeans
>>> from sklearn.metrics import calinski_harabasz_score
>>> X, _ = make_blobs(random_state=0)
>>> kmeans = KMeans(n_clusters=3, random_state=0,).fit(X)
>>> calinski_harabasz_score(X, kmeans.labels_)
np.float64(114.8...)