SVM(支持向量机)的一些思考:在margin上却不属于支持向量
创始人
2024-05-09 00:36:15

首先支持向量机问题:

min⁡β,β012∥β∥2+C∑i=1Nξis.t.ξi≥0,yi(xiTβ+β0)≥1−ξi,∀i(12.8)\begin{array}{ll} \underset{\beta,\beta_0}{\min}&\;\frac{1}{2}\Vert\beta\Vert^2+C\sum\limits_{i=1}^N\xi_i\\ s.t.& \xi_i\ge 0\;,y_i(x_i^T\beta+\beta_0)\ge 1-\xi_i,\forall i \end{array} \tag{12.8}β,β0​min​s.t.​21​∥β∥2+Ci=1∑N​ξi​ξi​≥0,yi​(xiT​β+β0​)≥1−ξi​,∀i​(12.8)

拉格朗日函数:

LP=12∥β∥2+C∑i=1Nξi−∑i=1Nαi[yi(xiTβ+β0)−(1−ξi)]−∑i=1Nμiξi(12.9)L_P=\frac{1}{2}\Vert\beta\Vert^2+C\sum\limits_{i=1}^N\xi_i-\sum\limits_{i=1}^N\alpha_i[y_i(x_i^T\beta+\beta_0)-(1-\xi_i)]-\sum\limits_{i=1}^{N}\mu_i\xi_i\tag{12.9}LP​=21​∥β∥2+Ci=1∑N​ξi​−i=1∑N​αi​[yi​(xiT​β+β0​)−(1−ξi​)]−i=1∑N​μi​ξi​(12.9)

先写出KKT条件:

12.10:对β\betaβ求偏导,12.11:对β0\beta_0β0​求偏导,12.12:对ϵi\epsilon_iϵi​求偏导

β=∑i=1Nαiyixi0=∑i=1Nαiyiαi=C−μi,∀i,\begin{align} \beta&=\sum\limits_{i=1}^N\alpha_iy_ix_i& \tag{12.10}\\ 0&= \sum\limits_{i=1}^N\alpha_iy_i& \tag{12.11}\\ \alpha_i&=C-\mu_i,\;\forall i,& \tag{12.12} \end{align}β0αi​​=i=1∑N​αi​yi​xi​=i=1∑N​αi​yi​=C−μi​,∀i,​​(12.10)(12.11)(12.12)​

αi[yi(xiTβ+β0)−(1−ξi)]=0μiξi=0yi(xiTβ+β0)−(1−ξi)≥0\begin{align} \alpha_i[y_i(x_i^T\beta+\beta_0)-(1-\xi_i)]&=0& \tag{12.14}\\ \mu_i\xi_i&=0& \tag{12.15}\\ y_i(x_i^T\beta+\beta_0)-(1-\xi_i)&\ge 0& \tag{12.16} \end{align}αi​[yi​(xiT​β+β0​)−(1−ξi​)]μi​ξi​yi​(xiT​β+β0​)−(1−ξi​)​=0=0≥0​​(12.14)(12.15)(12.16)​

KKT条件总结了两种情况:

  1. 极值在边界取到,此时约束取等号
  2. 极值在可行域内部取到,此时约束取不等号

因此分类可得(注意这里分类的技巧,必须按照约束是否为0进行分类,如果用变量是否为0进行分类,则变量为0时,约束仍然可能为0,需要再次分类):

  • 当ξi=0\xi_i=0ξi​=0时,点在边缘上,μ≥0\mu\ge 0μ≥0(12.15),

    • yi(xiTβ+β0)−1=0y_i(x_i^T\beta+\beta_0)-1=0yi​(xiT​β+β0​)−1=0:点落在边缘上,此时根据12.12,0≤α
    • yi(xiTβ+β0)−1>0y_i(x_i^T\beta+\beta_0)-1>0yi​(xiT​β+β0​)−1>0:点在边缘外,此时根据12.14,α=0\alpha=0α=0, μ=C\mu=Cμ=C
  • 当ξ>0\xi_>0ξ>​0时,点在边缘内侧,不满足原来的约束,μ=0\mu= 0μ=0(12.15)

    • yi(xiTβ+β0)−(1−ξi)≥0y_i(x_i^T\beta+\beta_0)-(1-\xi_i)\ge 0yi​(xiT​β+β0​)−(1−ξi​)≥0,α=C\alpha=Cα=C(12.12)

点在边缘外侧,α=C\alpha=Cα=C,点在边缘内侧α=0\alpha=0α=0,点在边缘上,α\alphaα可能等于0。

为什么在边缘上仍然不是支持向量呢?

根据拉格朗日乘数法:∇f(x)=−αh(x)\nabla f(x)=-\alpha h(x)∇f(x)=−αh(x) ,其中f是目标函数也就是12w2\frac12w^221​w2,h是约束,

而α=0\alpha=0α=0时,说明∇f(x)=0\nabla f(x)=0∇f(x)=0,也就是w=0w=0w=0,代入原方程可以得到w=0, b=0,这是我们需要避免的。因此这种情况是不会出现的,换句话说在边缘上的一定是支持向量。

相关内容

热门资讯

猫咪吃了塑料袋怎么办 猫咪误食... 你知道吗?塑料袋放久了会长猫哦!要说猫咪对塑料袋的喜爱程度完完全全可以媲美纸箱家里只要一有塑料袋的响...
脚上的穴位图 脚面经络图对应的... 人体穴位作用图解大全更清晰直观的标注了各个人体穴位的作用,包括头部穴位图、胸部穴位图、背部穴位图、胳...
demo什么意思 demo版本... 618快到了,各位的小金库大概也在准备开闸放水了吧。没有小金库的,也该向老婆撒娇卖萌服个软了,一切只...
北京的名胜古迹 北京最著名的景... 北京从元代开始,逐渐走上帝国首都的道路,先是成为大辽朝五大首都之一的南京城,随着金灭辽,金代从海陵王...