加权众数#

sklearn.utils.extmath.weighted_mode(a, w, *, axis=0)[source]#

返回传入数组中加权众数(最常见的值)的数组。

如果有多个这样的值,则只返回第一个。还返回众数的计数。

这是scipy.stats.mode中算法的扩展。

参数:
aarray-like of shape (n_samples,)

要查找众数的数组。

warray-like of shape (n_samples,)

每个值的权重数组。

axisint, default=0

操作的轴。默认为0,即第一个轴。

返回:
valsndarray

众数值数组。

scorendarray

每个众数的加权计数数组。

参见

scipy.stats.mode

计算沿指定轴的数组元素的众数(最常见的值)。

示例

>>> from sklearn.utils.extmath import weighted_mode
>>> x = [4, 1, 4, 2, 4, 2]
>>> weights = [1, 1, 1, 1, 1, 1]
>>> weighted_mode(x, weights)
(array([4.]), array([3.]))

值4出现了三次:如果权重均匀,结果就是分布的众数。

>>> weights = [1, 3, 0.5, 1.5, 1, 2]  # deweight the 4's
>>> weighted_mode(x, weights)
(array([2.]), array([3.5]))

数值 2 得分最高:它出现了两次,权重分别为 1.5 和 2,两者之和为 3.5。