support vector machines,SVM是二类分类模型。定义在特征空间上间隔最大的线性分类器,由于包括核技巧实质上成为非线性分类器。学习策略是间隔最大化,可形式化为求解凸二次规划问题(convex quadratic programming)。求解算法是求解凸二次规划的最优化算法。 S ...
分类:
其他好文 时间:
2018-03-08 15:56:02
阅读次数:
513
主要知识点: boolean model IF/IDF vector space model 一、boolean model 在es做各种搜索进行打分排序时,会先用boolean model 进行初步的筛选,boolean model类似and这种逻辑操作符,先过滤出包含指定term的doc。mus... ...
分类:
编程语言 时间:
2018-03-08 13:52:33
阅读次数:
159
对标题党新闻识别技术的相关知识进行研究和总结,包括网页去噪工作原理、向量空间模型和矩阵的奇异值分解的相关知识。了解基于潜在语义分析的标题党识别系统,学习其相关技术,包括向量空间模型的构建、基于SVD的塌陷矩阵构建模块和基于LSA算法的标题党新闻判定模块。 主要工作内容:数据集特征分析及模型训练大神给 ...
分类:
其他好文 时间:
2018-02-23 12:06:59
阅读次数:
184
线性代数导论 12 向量空间的衍生:矩阵空间、微分方程的解、图 凡是可以进行加法和数乘运算的对象,我们都可以将其视为向量。 凡是对加法和数乘封闭的集合,我们都可以将其视为空间。 分析空间时,我们着眼于其维度和基。 矩阵空间:把矩阵视为向量 矩阵空间的维度与基 矩阵空间的交集与“合集” 秩1矩阵:ra ...
分类:
其他好文 时间:
2018-02-19 17:53:18
阅读次数:
153
线性代数导论-#10 线性相关性、向量空间的基和维数 这节课中,我们先讲了前面的课程中一直提及的线性相关性的具体定义,并以此为基础建立了向量空间的“基”和“维数”的定义,最后归纳为一种已知若干向量求其生成的空间的基和维数的系统方法。 首先是线性相关性的定义。 已知一个由n个向量构成的向量组【V1,V ...
分类:
其他好文 时间:
2018-02-10 15:55:11
阅读次数:
147
Solr 4及之前的版本默认采用VSM(向量空间模型)进行相似度的计算(或打分)。之后的版本,则采用Okapi BM25(一种二元独立模型的扩展),属于概率模型。 ...
分类:
编程语言 时间:
2018-02-02 18:39:23
阅读次数:
430
线性代数-#6 向量空间、列空间、Rn与子空间 让我们回想一下#1的内容,当我们在用向量的新视角看待线性方程组时,曾经提到以“向量的图像”作为代数学与几何学桥梁的想法。 而现在,让我们沿着这个想法深入探索下去,将其作为开启线性代数核心学习的钥匙。 引入新概念:向量空间。 什么是向量空间?我们把向量构 ...
分类:
其他好文 时间:
2018-01-27 23:13:14
阅读次数:
180
线性代数-#5 矩阵变换之置换与转置 在之前的基础课程中,我们以用于解线性方程组的Gauss消元法为主线,介绍了矩阵语言这一表示法如Ax=b,介绍了一些特殊的矩阵如单位矩阵I、初等矩阵E、上三角矩阵U、下三角矩阵L,学习了矩阵乘法这一矩阵的基本运算,学习了矩阵变换中的逆变换,并运用它们进行了矩阵的L ...
分类:
其他好文 时间:
2018-01-27 19:06:55
阅读次数:
154
来回顾一下对于给出$n$个数,选出$k$个数,使得它们异或和最大的问题。 当$k = 2$时,可以用Trie上贪心把它水过去。 那当k自定时呢? 从这里开始 向量和向量空间 向量空间的线性相关性和基 异或意义下的基 小练习 从这里开始 向量和向量空间 向量空间的线性相关性和基 异或意义下的基 小练习 ...
分类:
其他好文 时间:
2018-01-01 18:15:12
阅读次数:
201
kNN是一种基本分类与回归方法。k-NN的输入为实例的特征向量,对应于特征空间中的点;输出为实例的类别,可以取多类。k近邻实际上利用训练数据集对特征向量空间进行划分,并作为其分类的“模型”。k值的选择、距离度量及分类决策规则是k近邻的三个基本要素。算法输入:训练数据集T={(x1,y1),(x2,y... ...
分类:
编程语言 时间:
2017-12-31 12:00:05
阅读次数:
137