weighted_mode#

sklearn.utils.extmath.weighted_mode(a, w, *, axis=0)[source]#

返回传入数组中加权众数(最常见)值的数组。

如果存在多个此类值,则只返回第一个。众数 bin 的 bin 计数也会返回。

这是 scipy.stats.mode 算法的扩展。

参数:
a形状为 (n_samples,) 的类数组

要查找众数(或多个众数)的数组。

w形状为 (n_samples,) 的类数组

每个值的权重数组。

axis整数,默认值=0

操作的轴。默认为 0,即第一个轴。

返回值:
valsndarray

众数数组。

scorendarray

每个众数的加权计数数组。

另请参阅

scipy.stats.mode

计算数组元素沿指定轴的众数(最常见)值。

示例

>>> from sklearn.utils.extmath import weighted_mode
>>> x = [4, 1, 4, 2, 4, 2]
>>> weights = [1, 1, 1, 1, 1, 1]
>>> weighted_mode(x, weights)
(array([4.]), array([3.]))

值 4 出现了三次:在均匀权重下,结果就是分布的众数。

>>> weights = [1, 3, 0.5, 1.5, 1, 2]  # deweight the 4's
>>> weighted_mode(x, weights)
(array([2.]), array([3.5]))

值 2 的得分最高:它出现了两次,权重分别为 1.5 和 2:它们的总和是 3.5。