Parallel#

class sklearn.utils.parallel.Parallel(n_jobs=default(None), backend=default(None), return_as='list', verbose=default(0), timeout=None, pre_dispatch='2 * n_jobs', batch_size='auto', temp_folder=default(None), max_nbytes=default('1M'), mmap_mode=default('r'), prefer=default(None), require=default(None))[source]#

joblib.Parallel的调整,用于传播 scikit-learn 配置。

这个 joblib.Parallel 的子类确保 scikit-learn 的活动配置(线程局部)在并行任务执行期间传播到并行工作进程。

API 没有改变,您可以参考 joblib.Parallel 文档了解更多细节。

版本 1.3 中新增。

__call__(iterable)[source]#

调度任务并返回结果。

参数:
iterable可迭代对象

包含 (延迟函数, 参数, 关键字参数) 元组的可迭代对象,这些元组应该被使用。

返回值:
results列表

任务结果的列表。

dispatch_next()[source]#

调度更多数据进行并行处理

此方法旨在由多处理回调并发调用。我们依靠 `dispatch_one_batch` 的线程安全性来防止并发使用未受保护的迭代器。

dispatch_one_batch(iterator)[source]#

预取下一批任务并调度它们。

这里计算批次的有效大小。如果没有更多作业要调度,则返回 False,否则返回 True。

迭代器使用和调度由相同的锁保护,因此调用此函数应该是线程安全的。

format(obj, indent=0)[source]#

返回对象的格式化表示。

print_progress()[source]#

仅在一段时间内显示并行执行的进度,由 `self.verbose` 控制。