码迷,mamicode.com
首页 > 其他好文 > 详细

Feature hashing相关 - 2

时间:2014-12-04 17:30:57      阅读:186      评论:0      收藏:0      [点我收藏+]

标签:style   blog   http   io   ar   color   sp   strong   on   

  1. Bloom filter

? ?

bubuko.com,布布扣

思路 用多个不同hash 来记录,比如遇到一个 love 有4个hash function 映射到4个bit位置,如果所有位置都是1 那么认为之前已经遇到love这个词(有一定错误概率),如果有任何一个位置是0,那么表明love这个词之前没有遇到(100%这样)

? ?

  1. Count Min Sketch

    思路类似。。 考虑一个近似的(允许一定错误)的类似 hash table的 <key,value>更新查询操作

    ? ?

bubuko.com,布布扣

论文 :An Improved Data Stream Summary: The Count-Min Sketch and its Applications

? ?

将输入的i 映射到 1-w , 采用d个hash function,开辟 w*d的空间

bubuko.com,布布扣

bubuko.com,布布扣

执行

bubuko.com,布布扣

? ?

查询i的时候,取最小值!

bubuko.com,布布扣

? ?

对于类似文本分类,线性svm这样我们关注的 dot(inner product点积)操作:

只给出结论

bubuko.com,布布扣

也就是说只要按照w长度的空间向量进行点积即可,然后对应d个hash function取其中的最小值,算法复杂度O(w+d)

? ?

Feature hashing相关 - 2

标签:style   blog   http   io   ar   color   sp   strong   on   

原文地址:http://www.cnblogs.com/rocketfan/p/4143150.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!