• 2025年10月10日 星期五

2.8.1-转化为对偶问题与思考推导过程

8 月 12, 2025

先来回顾目前SVM的优化问题:

δi是slack(允许误差的大小),C是正则化参数(平衡间隔和误差)

上一讲中的限制条件:

在SVM的限制条件中yiTXi+b)≥1(≥0)

需要将δi从≥0转变为:δi≤0(i=1~N).

可以得到新的目标函数:

限制条件也要进行改变:

上一篇自变量ω在此处=(ω,b,δi)的组合。

gi(ω)≤0分为(1)δi≤0(i=1~N).(2)i+δi-yiωTφ(Xi)-yib≤0(i=1~N)。本篇无等式限制条件因此不存在hi(ω)≤0

将对偶问题写成如下形式:

限制条件(1)(2)对应将gi(ω)≤0拆分成两个部分的条件

那么如何化为对偶问题?

对(ω,b,δi)求导并令导数为0

🟥 一条条推导图片中的三个公式:

我们知道了αi≥0是第一个约束;βi≥0是第二个约束

拉格朗日函数有:


✅ (1) 对 ω 求偏导:

从上面这个 θ对ω 求偏导数:

拉格朗日中关于ω 的项有:

求导得:

✅ 解出:

这意味着最终超平面的方向 ω 是由所有支持向量的线性组合组成的。


✅ (2) 对 δi 求偏导:

在拉格朗日中,δi 出现了三次:

  • +Cδi
  • - αiδi
  • - βiδi

所以:

✅ 解出: αii=C

这个式子揭示了软间隔下 αi 的上限约束,它不能超过 C,因为多余的惩罚会被 βi 抵消。


✅ (3) 对 b 求偏导:

b 只在 αi 项中出现,即:

所以偏导是:

✅ 解出:

这是KKT 对偶可行性条件的一个核心结果,它限制了 αi 的线性组合,使得最终的超平面具有对称性。

🟨 总结对图片三式的解释:

式子编号来源意义
(1) ω = Σαiyiφ(xi )对 ω 求偏导表示超平面是支持向量的线性组合
(2) αi + βi=C对 δi 求导控制 αi 不超过 C,由软间隔条件决定
(3) Σαiyi = 0对 b 求导保证最终分界平面居中,SVM 的基本结构要求


微信扫描下方的二维码阅读本文

Avatar photo

李星海

简介: 2025-今 浙江农林大学 | 2022-今 广州白蓝碗蛋科技有限公司 | 2022-2024 广州商学院 | 2019-2022 广东工贸职业技术学院 | 服务宗旨:心始至客,行亦致远。