cluster_optics_xi#

sklearn.cluster.cluster_optics_xi(*, reachability, predecessor, ordering, min_samples, min_cluster_size=None, xi=0.05, predecessor_correction=True)[source]#

根据 Xi-steep 方法自动提取聚类。

参数:

reachability形状为 (n_samples,) 的 ndarray: 由 OPTICS 计算的可达性距离（reachability_）。
predecessor形状为 (n_samples,) 的 ndarray: 由 OPTICS 计算的前驱。
ordering形状为 (n_samples,) 的 ndarray: OPTICS 排序点索引（ordering_）。
min_samples大于 1 的整数或介于 0 和 1 之间的浮点数: 与提供给 OPTICS 的 min_samples 相同。向上和向下的陡峭区域不能包含超过 min_samples 个连续的非陡峭点。表示为绝对数字或样本数的某个分数（四舍五入后至少为 2）。
min_cluster_size大于 1 的整数或介于 0 和 1 之间的浮点数，默认值=None: OPTICS 聚类中的最小样本数，表示为绝对数字或样本数的某个分数（四舍五入后至少为 2）。如果为 None，则使用 min_samples 的值。
xi介于 0 和 1 之间的浮点数，默认值=0.05: 确定可达性图上构成聚类边界的最小陡峭度。例如，可达性图中的一个向上点定义为从一个点到其后继点的比率至多为 1-xi。
predecessor_correction布尔值，默认值=True: 根据计算出的前驱修正聚类。

返回值:

labels形状为 (n_samples,) 的 ndarray: 分配给样本的标签。不属于任何聚类的点被标记为 -1。
clusters形状为 (n_clusters, 2) 的 ndarray: 聚类列表，每行形式为 [start, end]，所有索引都包含在内。聚类按 (end, -start)（升序）排序，以便包含较小聚类的较大聚类出现在此类嵌套较小聚类之后。由于 labels 不反映层次结构，通常 len(clusters) > np.unique(labels)。

示例

>>> import numpy as np
>>> from sklearn.cluster import cluster_optics_xi, compute_optics_graph
>>> X = np.array([[1, 2], [2, 5], [3, 6],
...               [8, 7], [8, 8], [7, 3]])
>>> ordering, core_distances, reachability, predecessor = compute_optics_graph(
...     X,
...     min_samples=2,
...     max_eps=np.inf,
...     metric="minkowski",
...     p=2,
...     metric_params=None,
...     algorithm="auto",
...     leaf_size=30,
...     n_jobs=None
... )
>>> min_samples = 2
>>> labels, clusters = cluster_optics_xi(
...     reachability=reachability,
...     predecessor=predecessor,
...     ordering=ordering,
...     min_samples=min_samples,
... )
>>> labels
array([0, 0, 0, 1, 1, 1])
>>> clusters
array([[0, 2],
       [3, 5],
       [0, 5]])

cluster_optics_xi#

本页