标签:ram lin log nbsp 类型 https zed sdn href
摘自
https://www.jianshu.com/p/1687f8964a32
https://blog.csdn.net/google19890102/article/details/45532745
1、FM又叫因子分解机。被广泛应用到广告点击中,跟LR相比,效果据说是强了不少。这个个人觉得还是利用数据集测试下比较靠谱。其主要解决的问题是当数据比较稀疏的时候,特征组合的问题。
2、以一个广告点击的例子。特征如下图所示
One hot编码后的特征如下图所示
当类型值特别多的时候,One-hot的特征量就会变得特别大。有些互联网特征有上亿纬就是这么来的。采用FM可以很好的学习这些特征之间的关系。
1、一般的模型为线性模型
2、
3、其中,v∈?^{n,k},vi,vj表示的是两个大小为k的向量之间的点积:
与线性模型相比,FM的模型就多了后面特征组合的部分。
对vi,vj求解
标签:ram lin log nbsp 类型 https zed sdn href
原文地址:https://www.cnblogs.com/ylxn/p/10716705.html