聚类光学 ξ#

sklearn.cluster.cluster_optics_xi(*, reachability, predecessor, ordering, min_samples, min_cluster_size=None, xi=0.05, predecessor_correction=True)[source]#

根据Xi-steep方法自动提取聚类。

参数:
reachabilityndarray 形状为 (n_samples,)

由OPTICS计算的可达距离 (reachability_)。

predecessorndarray 形状为 (n_samples,)

由OPTICS计算的前驱。

orderingndarray 形状为 (n_samples,)

OPTICS排序后的点索引 (ordering_)。

min_samplesint > 1 或 0 到 1 之间的浮点数

与提供给OPTICS的min_samples相同。上升和下降陡峭区域连续的非陡峭点不能超过min_samples个。表示为绝对数或样本数的分数(四舍五入到至少2)。

min_cluster_sizeint > 1 或 0 到 1 之间的浮点数,默认为None

OPTICS聚类中样本的最小数量,表示为绝对数或样本数的分数(四舍五入到至少2)。如果为None,则使用min_samples的值。

xi0到1之间的浮点数,默认为0.05

确定可达性图上构成聚类边界的最小陡峭程度。例如,可达性图中向上的一点定义为一点与其后继者比率最多为1-xi。

predecessor_correction布尔值,默认为True

根据计算出的前驱校正聚类。

返回:
labelsndarray 形状为 (n_samples,)

分配给样本的标签。不包含在任何聚类中的点标记为-1。

clustersndarray 形状为 (n_clusters, 2)

[start, end]形式的聚类列表,每一行都包含所有索引。聚类根据(end, -start)(升序)排序,以便包含较小聚类的较大聚类位于这些嵌套的较小聚类之后。由于labels不反映层次结构,通常len(clusters) > np.unique(labels)

示例

>>> import numpy as np
>>> from sklearn.cluster import cluster_optics_xi, compute_optics_graph
>>> X = np.array([[1, 2], [2, 5], [3, 6],
...               [8, 7], [8, 8], [7, 3]])
>>> ordering, core_distances, reachability, predecessor = compute_optics_graph(
...     X,
...     min_samples=2,
...     max_eps=np.inf,
...     metric="minkowski",
...     p=2,
...     metric_params=None,
...     algorithm="auto",
...     leaf_size=30,
...     n_jobs=None
... )
>>> min_samples = 2
>>> labels, clusters = cluster_optics_xi(
...     reachability=reachability,
...     predecessor=predecessor,
...     ordering=ordering,
...     min_samples=min_samples,
... )
>>> labels
array([0, 0, 0, 1, 1, 1])
>>> clusters
array([[0, 2],
       [3, 5],
       [0, 5]])