小波变换的数学基础(一) 这一节将会描述小波分析理论的主要概念,这些概念也可以被看成是大部分信号分析方法的准则。傅立叶定义的傅立叶变换是用一些基础函数来分析和重构一个函数。向量空间中的每一个向量都是向量基的线性组合,如把一些常数和向量相乘,然后计算点积。对信号的分析就包括估计这些常数(变换系数,傅立 ...
分类:
其他好文 时间:
2019-11-16 12:33:22
阅读次数:
70
item2vec将用户的行为序列转化成item组成的句子,模仿word2vec训练word embedding将item embedding。基本思想是把原来高维稀疏的表示方式(one_hot)映射到低维稠密的向量空间中,这样我们就可以用这个低维向量来表示该项目(电影),进而通过计算两个低维向量之间 ...
分类:
编程语言 时间:
2019-10-30 18:49:05
阅读次数:
205
搜索结果排序是搜索引擎最核心的构成部分,很大程度上决定了搜索引擎的质量好坏。虽然搜索引擎在实际结果排序时考虑了上百个相关因子,但最重要的因素还是用户查询与网页内容的相关性。(ps:百度最臭名朝著的“竞价排名”策略,就是在搜索结果排序时,把广告客户给钱最多的排在前列,而不是从内容质量考虑,从而严重影响 ...
分类:
其他好文 时间:
2019-09-13 17:37:50
阅读次数:
104
简单介绍 LSA和传统向量空间模型(vector space model)一样使用向量来表示词(terms)和文档(documents),并通过向量间的关系(如夹角)来判断词及文档间的关系;不同的是,LSA 将词和文档映射到潜在语义空间,从而去除了原始向量空间中的一些“噪音”,提高了信息检索的精确度 ...
分类:
其他好文 时间:
2019-09-03 15:00:27
阅读次数:
222
在文本挖掘与文本分类的有关问题中,文本最初始的数据是将文档表示成向量空间模型的一个矩阵,而这个矩阵所拥有的就是不同的词,常采用特征选择方法。原因是文本的特征一般都是单词(term),具有语义信息,使用特征选择找出的k维子集,仍然是单词作为特征,保留了语义信息,而特征提取则找k维新空间,将会丧失了语义 ...
分类:
编程语言 时间:
2019-09-01 01:16:49
阅读次数:
99
多项式拟合 前言: 任何可微的函数都可以用一个N次多项式来估计, 而比N次幂更高阶的部分为无穷小量. 多项式拟合与线性拟合的区别就是: 线性拟合是使用向量空间中的直线去拟合离散的数据点 多项式拟合是使用连续的曲线去拟合离散的数据点 Key_Function: np.polyfit函数: 输入x轴数组 ...
分类:
其他好文 时间:
2019-08-21 23:09:14
阅读次数:
133
(注:这里不再对算法公式累述)1.相似度算法1.1Jaccard距离使用集合中的不同元素的比例来衡量两个集合的区分度,但是存在比较明显的问题无法关注到集合中元素的权重值(评分)1.2余弦相似度利用向量空间解决了权重值(评分)带入相似度计算的问题,非常常用的相似度算法,弥补了Jaccard距离计算的不足1.3Pearson相似度(又名中心余弦相似度)Pearson相似度是对余弦相似度改进,简明来说就
分类:
编程语言 时间:
2019-07-20 14:30:47
阅读次数:
126
当模型需要接受多个模态的数据时,往往需要设计合适的方法让他们能进行信息的融合,Joint embedding是一种较为普遍的思路,即将他们映射到同一个向量空间中,再进行融合。 向量拼接、元素级相乘、做out product得到矩阵、求和。缺点是缺乏表达能力 Multimodal Compact Bi ...
分类:
其他好文 时间:
2019-07-18 19:48:15
阅读次数:
202
python通过BF算法实现关键词匹配,BF算法,即暴风(BruteForce)算法,是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和T的第二个字符;若不相等,则比较S的第二个字符和T的第一个字符,依次比较下去,直到得出最后的匹配结果。BF算法是一种蛮力算法。#!/usr/bin/python#-*-coding:UT
分类:
编程语言 时间:
2019-06-22 23:43:03
阅读次数:
196
1.1.为什么选择加倍(两倍)扩容?而不是根据固定容量扩容?(在copyFrom函数中同理申请了双倍空间内存的理由) 这里涉及到了一个成本分摊的概念。 假设我们初始容量为0的vector插入n个元素,这个n个元素可以定义为n=m*I,插入了I次, 固定扩容容量变为m。 (1)如果我们选择根据每次插入 ...
分类:
其他好文 时间:
2019-06-19 20:13:53
阅读次数:
107