在鸢尾花数据集上绘制不同的 SVM 分类器#

在鸢尾花数据集的二维投影上比较不同的线性 SVM 分类器。我们只考虑该数据集的前 2 个特征

  • 花萼长度

  • 花萼宽度

此示例展示了如何为四种具有不同核的 SVM 分类器绘制决策边界。

线性模型 LinearSVC()SVC(kernel='linear') 会产生略微不同的决策边界。这可能是由于以下差异造成的

  • LinearSVC 最小化平方合页损失,而 SVC 最小化常规合页损失。

  • LinearSVC 使用一对多(也称为 One-vs-Rest)多类别降维,而 SVC 使用一对一多类别降维。

两种线性模型都具有线性决策边界(相交超平面),而非线性核模型(多项式或高斯 RBF)则具有更灵活的非线性决策边界,其形状取决于核的类型及其参数。

注意

虽然为玩具二维数据集绘制分类器的决策函数有助于直观地理解它们各自的表达能力,但请注意,这些直觉并非总能推广到更真实的高维问题。

SVC with linear kernel, LinearSVC (linear kernel), SVC with RBF kernel, SVC with polynomial (degree 3) kernel
# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

import matplotlib.pyplot as plt

from sklearn import datasets, svm
from sklearn.inspection import DecisionBoundaryDisplay

# import some data to play with
iris = datasets.load_iris()
# Take the first two features. We could avoid this by using a two-dim dataset
X = iris.data[:, :2]
y = iris.target

# we create an instance of SVM and fit out data. We do not scale our
# data since we want to plot the support vectors
C = 1.0  # SVM regularization parameter
models = (
    svm.SVC(kernel="linear", C=C),
    svm.LinearSVC(C=C, max_iter=10000),
    svm.SVC(kernel="rbf", gamma=0.7, C=C),
    svm.SVC(kernel="poly", degree=3, gamma="auto", C=C),
)
models = (clf.fit(X, y) for clf in models)

# title for the plots
titles = (
    "SVC with linear kernel",
    "LinearSVC (linear kernel)",
    "SVC with RBF kernel",
    "SVC with polynomial (degree 3) kernel",
)

# Set-up 2x2 grid for plotting.
fig, sub = plt.subplots(2, 2)
plt.subplots_adjust(wspace=0.4, hspace=0.4)

X0, X1 = X[:, 0], X[:, 1]

for clf, title, ax in zip(models, titles, sub.flatten()):
    disp = DecisionBoundaryDisplay.from_estimator(
        clf,
        X,
        response_method="predict",
        cmap=plt.cm.coolwarm,
        alpha=0.8,
        ax=ax,
        xlabel=iris.feature_names[0],
        ylabel=iris.feature_names[1],
    )
    ax.scatter(X0, X1, c=y, cmap=plt.cm.coolwarm, s=20, edgecolors="k")
    ax.set_xticks(())
    ax.set_yticks(())
    ax.set_title(title)

plt.show()

脚本总运行时间: (0 分 0.201 秒)

相关示例

鸢尾花数据集上半监督分类器与 SVM 的决策边界

鸢尾花数据集上半监督分类器与 SVM 的决策边界

带自定义核的 SVM

带自定义核的 SVM

在 LinearSVC 中绘制支持向量

在 LinearSVC 中绘制支持向量

鸢尾花数据集上的主成分分析 (PCA)

鸢尾花数据集上的主成分分析 (PCA)

由 Sphinx-Gallery 生成的图库