weighted_mode#
- sklearn.utils.extmath.weighted_mode(a, w, *, axis=0)[source]#
返回传入数组中加权众数(最常见)值的数组。
如果存在多个此类值,则只返回第一个。众数 bin 的 bin 计数也会返回。
这是 scipy.stats.mode 算法的扩展。
- 参数:
- a形状为 (n_samples,) 的类数组
要查找众数(或多个众数)的数组。
- w形状为 (n_samples,) 的类数组
每个值的权重数组。
- axis整数,默认值=0
操作的轴。默认为 0,即第一个轴。
- 返回值:
- valsndarray
众数数组。
- scorendarray
每个众数的加权计数数组。
另请参阅
scipy.stats.mode
计算数组元素沿指定轴的众数(最常见)值。
示例
>>> from sklearn.utils.extmath import weighted_mode >>> x = [4, 1, 4, 2, 4, 2] >>> weights = [1, 1, 1, 1, 1, 1] >>> weighted_mode(x, weights) (array([4.]), array([3.]))
值 4 出现了三次:在均匀权重下,结果就是分布的众数。
>>> weights = [1, 3, 0.5, 1.5, 1, 2] # deweight the 4's >>> weighted_mode(x, weights) (array([2.]), array([3.5]))
值 2 的得分最高:它出现了两次,权重分别为 1.5 和 2:它们的总和是 3.5。