sklearn.metrics#

评分函数、性能指标、成对度量和距离计算。

**用户指南。** 请参阅 指标和评分:量化预测质量成对度量、亲和度和核函数 部分以了解更多详细信息。

模型选择接口#

用户指南。更多详情请参见评分参数:定义模型评估规则 部分。

check_scoring

根据用户选项确定评分器。

get_scorer

从字符串中获取评分器。

get_scorer_names

获取所有可用评分器的名称。

make_scorer

从性能指标或损失函数创建评分器。

分类指标#

用户指南。更多详情请参见分类指标 部分。

准确率得分

准确率分类评分。

AUC (曲线下面积)

使用梯形法则计算曲线下面积 (AUC)。

平均精确率得分

根据预测分数计算平均精度 (AP)。

平衡准确率得分

计算平衡准确率。

Brier 评分损失

计算 Brier 评分损失。

类别似然比

计算二元分类的正负似然比。

分类报告

构建显示主要分类指标的文本报告。

Cohen Kappa 系数

计算 Cohen 的 kappa 系数:衡量注释者之间一致性的统计量。

混淆矩阵

计算混淆矩阵以评估分类的准确性。

D2 对数损失得分

\(D^2\) 分数函数,解释的 log 损失分数。

DCG (折扣累积增益) 得分

计算折损累计增益 (DCG)。

DET 曲线

计算不同概率阈值的错误率。

F1 得分

计算 F1 分数,也称为平衡 F 分数或 F 测度。

Fβ 得分

计算 F-beta 分数。

汉明损失

计算平均汉明损失。

铰链损失

平均铰链损失(非正则化)。

Jaccard 得分

Jaccard 相似系数评分。

对数损失

对数损失,也称为逻辑损失或交叉熵损失。

Matthews 相关系数

计算 Matthews 相关系数 (MCC)。

多标签混淆矩阵

为每个类别或样本计算混淆矩阵。

NDCG (归一化折扣累积增益) 得分

计算归一化折损累计增益 (NDCG)。

精确率-召回率曲线

计算不同概率阈值的精确率-召回率对。

精确率、召回率、F-score 和支持度

为每个类别计算精确率、召回率、F 测度和支持度。

精确率得分

计算精确率。

召回率得分

计算召回率。

ROC AUC 得分

根据预测分数计算受试者工作特征曲线下面积 (ROC AUC)。

ROC 曲线

计算受试者工作特征 (ROC) 曲线。

Top-K 准确率得分

Top-k 准确率分类评分。

零一损失

零一分类损失。

回归指标#

用户指南。更多详情请参见回归指标 部分。

D2 绝对误差得分

\(D^2\) 回归评分函数,解释的绝对误差分数。

D2 分位数得分

\(D^2\) 回归评分函数,解释的分位数损失分数。

D2 Tweedie 得分

\(D^2\) 回归评分函数,解释的 Tweedie 偏差分数。

解释方差得分

解释方差回归评分函数。

最大误差

max_error 指标计算最大残差误差。

平均绝对误差

平均绝对误差回归损失。

平均绝对百分比误差

平均绝对百分比误差 (MAPE) 回归损失。

平均伽马偏差

平均 Gamma 偏差回归损失。

平均分位数损失

分位数回归的 Pinball 损失。

平均泊松偏差

平均泊松偏差回归损失。

均方误差

均方误差回归损失。

均方对数误差

均方对数误差回归损失。

平均 Tweedie 偏差

平均 Tweedie 偏差回归损失。

中位数绝对误差

中位数绝对误差回归损失。

R方得分

\(R^2\)(决定系数)回归评分函数。

均方根误差

均方根误差回归损失。

均方根对数误差

均方根对数误差回归损失。

多标签排序指标#

用户指南。更多详情请参见多标签排序指标 部分。

覆盖误差

覆盖误差度量。

标签排序平均精确率得分

计算基于排序的平均精度。

标签排序损失

计算基于排序的损失度量。

聚类指标#

用于聚类分析结果的评估指标。

  • 监督式评估使用每个样本的真实类值。

  • 无监督评估不使用真实值,而是衡量模型本身的“质量”。

用户指南。更多详情请参见聚类性能评估 部分。

调整后的互信息得分

两个聚类之间的调整互信息。

调整后的 Rand 指数

经机会校正的 Rand 指数。

Calinski-Harabasz 指数

计算 Calinski-Harabasz 分数。

cluster.contingency_matrix

构建描述标签之间关系的列联表。

cluster.pair_confusion_matrix

来自两个聚类的配对混淆矩阵。

完整性得分

计算给定真实值的聚类标签的完整性度量。

Davies-Bouldin 指数

计算 Davies-Bouldin 分数。

Fowlkes-Mallows 指数

测量一组点的两个聚类的相似性。

同质性、完整性和 V-measure

一次计算同质性、完整性和 V-测度分数。

同质性得分

给定真实值的聚类标签的同质性度量。

互信息得分

两个聚类之间的互信息。

归一化互信息得分

两个聚类之间的归一化互信息。

Rand 指数

Rand 指数。

轮廓样本

计算每个样本的轮廓系数。

轮廓系数

计算所有样本的平均轮廓系数。

V-measure 得分

给定真实值的 V-测度聚类标签。

双聚类指标#

用户指南。更多详情请参见双聚类评估 部分。

一致性得分

两组双聚类的相似性。

距离度量#

距离度量

快速距离度量函数的统一接口。

成对度量#

用于样本集的成对距离和亲和度的度量。

用户指南。更多详情请参见成对度量、亲和性和核函数 部分。

pairwise.additive_chi2_kernel

计算 X 和 Y 中观测值之间的加性卡方核。

pairwise.chi2_kernel

计算 X 和 Y 之间的指数卡方核。

pairwise.cosine_distances

计算 X 和 Y 中样本之间的余弦距离。

pairwise.cosine_similarity

计算 X 和 Y 中样本之间的余弦相似度。

pairwise.distance_metrics

pairwise_distances 的有效度量。

pairwise.euclidean_distances

计算向量数组 X 和 Y 中每一对之间的距离矩阵。

pairwise.haversine_distances

计算 X 和 Y 中样本之间的 Haversine 距离。

pairwise.kernel_metrics

pairwise_kernels 的有效度量。

pairwise.laplacian_kernel

计算 X 和 Y 之间的拉普拉斯核。

pairwise.linear_kernel

计算 X 和 Y 之间的线性核。

pairwise.manhattan_distances

计算 X 和 Y 中向量之间的 L1 距离。

pairwise.nan_euclidean_distances

在存在缺失值的情况下计算欧几里德距离。

pairwise.paired_cosine_distances

计算 X 和 Y 之间的配对余弦距离。

pairwise.paired_distances

计算 X 和 Y 之间的配对距离。

pairwise.paired_euclidean_distances

计算 X 和 Y 之间的配对欧几里德距离。

pairwise.paired_manhattan_distances

计算X和Y之间的配对L1距离。

pairwise.pairwise_kernels

计算数组X和可选数组Y之间的核函数。

pairwise.polynomial_kernel

计算X和Y之间的多项式核函数。

pairwise.rbf_kernel

计算X和Y之间的RBF(高斯)核函数。

pairwise.sigmoid_kernel

计算X和Y之间的Sigmoid核函数。

成对距离

从向量数组X和可选的Y计算距离矩阵。

成对距离最小参数

计算一个点与一组点之间的最小距离。

成对距离最小值及其参数

计算一个点与一组点之间的最小距离。

分块成对距离

分块生成距离矩阵,并可选地进行约简。

绘图#

用户指南。更多详情请参见可视化部分。

混淆矩阵显示

混淆矩阵可视化。

DET 曲线显示

DET曲线可视化。

精确率-召回率显示

精确率-召回率曲线可视化。

预测误差显示

回归模型预测误差的可视化。

ROC 曲线显示

ROC曲线可视化。