20. SVM¶

20.1. SVM vs Logistic Regression vs Neural Network¶

3种方法都可用于“监督学习”中的“分类问题”，根据”number of features”和”numbers of training examples”的相对关系做出选择，详见《ML 笔记》 week7 p63
SVM和LR更像，在一些方面作了简化，在另外的方面进行了强化：

是否需要使用“kernels”/“similarity functions”，要看“features个数”和“训练例子个数”的相对多少来决定，详见《ML NOTES》p63

要使用kernels，有几个关键点：

SVM的underfitting/overfitting会受到下列因素的影响，《ML》p61：

“C”对于bias和variance的影响，在视频的”Large Margin Intuition”小节中，通过C的大小对”decision boundary”的影响，可以视觉化的看到。

Margin: distance between decision boundary and examples.
SVM又称为Large Margin Classfier,为什么说SVM的cost function是large margin的原因?如下图，SVM的optimization object满足一定的条件时发生了变化。

由上图的cost function求得的Θ构成的decision boundary就会是下图的“黑色线”，而不是“绿色”或“紫色”

而且，下面这副图说明了，既要使||Θ||最小化，又要满足constraints对于||Θ||取值范围的限定，只能是 projection 尽量大，所以SVM选择下图右侧的绿色的decision boundary。

用向量内积来理解optimization object of SVM

向量内积有2种计算方式，当两个向量的夹角>90时，是负数，如下图

在讲义中例子是vector，如果是多维数组的内积呢？