标签:
svm特征格式:<label><index1>:<value1><index1>:<value1>....
其中<label> 是训练数据集的目标值,对于分类,它是标识某类的整数(支持多个类);对于回归,是任意实数。<index> 是以1开始的整数,可以是不连续的;<value>为实数,也就是我们常说的自变量。
这里面一个词<index1>:<value1>代表一维,如果要处理的某件事中有很多词是在同一维的比如训练人的特征,有身高,体重...则可以:
1 1:170 2:56 .......
-1 1:140 2:34 ......
不同行里面的特征放在同一样的维度中
如果要处理的事件中特征之间没有关系,比如垃圾短信的特征,顾客,贷款......则要:
1 1:特征1 2:特征2 ......9:特征9
-1 10:特征10 11:特征11.....100:特征100
第二行相当于前9维特征都设置成0,在这个例子里面特征维度是100,相当于在第一行里地10维以后的维度中的特征都设置成了0,即每一行的特征都是100维
标签:
原文地址:http://www.cnblogs.com/fclbky/p/4914031.html