sklearn.feature_extraction#
从原始数据中提取特征。
**用户指南。** 更多细节请参见特征提取 部分。
将特征值映射列表转换为向量。 |
|
实现特征哈希,也称为哈希技巧。 |
从图像#
用于从图像中提取特征的工具。
从图像集合中提取图像块。 |
|
将二维图像重塑为图像块集合。 |
|
像素到像素连接的图。 |
|
像素到像素梯度连接的图。 |
|
从所有图像块重建图像。 |
文本处理#
用于从文本文档构建特征向量的工具。
将文本文档集合转换为标记计数矩阵。 |
|
将文本文档集合转换为标记出现次数矩阵。 |
|
将计数矩阵转换为标准化的tf或tf-idf表示。 |
|
将原始文档集合转换为TF-IDF特征矩阵。 |