码迷,mamicode.com
首页 > 其他好文 > 详细

VC Dimension -衡量模型与样本的复杂度

时间:2016-12-12 22:05:45      阅读:180      评论:0      收藏:0      [点我收藏+]

标签:技术分享   提高   att   images   并且   复杂度   point   定义   技术   

(1)定义VC Dimension:

dichotomies数量的上限是成长函数,成长函数的上限是边界函数:

技术分享

所以VC Bound可以改写成:

技术分享

下面我们定义VC Dimension:

技术分享

对于某个备选函数集HVC Dimension就是它所能shatter的最大数据个数NVC Dimension = minimum break point - 1。所以在VC Bound中,(2N)^(k-1)可以替换为(2N)^(VC Dimension)VC Dimension与学习算法A,输入分布P,目标函数f均无关。

(2)PLAVC Dimension  

1DPLA最多shatter2个点,所以VC Dimension = 2      

2DPLA最多shatter3个点,所以VC Dimension = 3                                                       

猜测dDPLAVC Dimension会不会等于d+1 只需证明dvc≥d+1并且 dvc≤d+1

  • 证明VC Dimension≥d+1,只需证明H可以shatter某些d+1个输入。

构造一组d+1个输入:

 

图1

第一列灰色的1是对每个输入提高1维的操作,这个是一个d+1维的方阵,对角线全部是1,所以该矩阵可逆。即对于任意一种输出,我们总能找到一个备选函数使得

 

图2 

即这一组输入的所有dichotomies都被穷尽了,所以VC Dimension≥d+1得证

  • 证明VCDimension≤d+1,只需证H不能shatter任何d+2个输入

2D情形下构造一组4个输入:

技术分享

图3

所以 x4 = x3 + x2 - x1

 

VC Dimension -衡量模型与样本的复杂度

标签:技术分享   提高   att   images   并且   复杂度   point   定义   技术   

原文地址:http://www.cnblogs.com/nolonely/p/6165602.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!