Intro SVD分解是 singular value decomposition的缩写,也就是奇异值分解,它是spectral decomposition谱分解的推广(谱分解适用于方阵)。在机器学习中,这是一种非常有用的降维手段,另外它还可以构建主题词模型,可谓是功能丰富啊。本文通过一个简单的例子 ...
分类:
其他好文 时间:
2020-09-18 02:24:28
阅读次数:
37
索 引 号: 000014349/2017-00142 主题分类: 科技、教育\科技 发文机关: 国务院 成文日期: 2017年07月08日 标 题: 国务院关于印发新一代人工智能发展规划的通知 发文字号: 国发〔2017〕35号 发布日期: 2017年07月20日 主 题 词: 国务院关于印发 新 ...
分类:
其他好文 时间:
2019-12-05 01:06:52
阅读次数:
3814
索 引 号: 000014349/2016-00257 主题分类: 工业、交通\信息产业(含电信) 发文机关: 国务院 成文日期: 2016年12月15日 标 题: 国务院关于印发“十三五”国家信息化规划的通知 发文字号: 国发〔2016〕73号 发布日期: 2016年12月27日 主 题 词: 国 ...
分类:
其他好文 时间:
2019-11-25 18:06:07
阅读次数:
58
我的工程实践是《基于情感词典的文本情感分析》,下面是以我的工程实践为例来进行业务建模。 ?1)收集应用领域信息 –关注功能要求–还考虑其他需求和文档 本次项目主要是针对京东手机评论的情感分析,分析提取评论的情感偏向和主题词。通过分析某款手机的评论,得知商品的特点,即可以帮助商家改进产品,也可以满足消 ...
分类:
其他好文 时间:
2019-11-24 17:45:21
阅读次数:
72
今天由于自己的原因进度不是很大,今天整理了一下全网关联的思路流程(个人可能就是那种没自信,在思路不知道对不对的情况下不敢下手那种渣渣),和之前的一个学长讨论了一下大概思路流程,如下: (1)使用LDA模型提取一篇新闻主题词,确定最大概率主题词; (2)新闻追踪时使用主题与主题之间的关联(相似度比对) ...
分类:
其他好文 时间:
2019-11-06 23:12:27
阅读次数:
108
主题词1998-fmkgm先-天性-1992@2015-畸形:新-生-儿-疾病-预防(卫生) ...
分类:
数据库 时间:
2019-03-14 15:14:30
阅读次数:
203
1.jieba.analyse.extract_tags(text) text必须是一连串的字符串才可以 第一步:进行语料库的读取 第二步:进行分词操作 第三步:载入停用词,同时对分词后的语料库进行停用词的去除 第四步:选取一段文本分词列表,串接成字符串,使用jieba.analyse.extrac ...
分类:
其他好文 时间:
2019-01-19 00:45:32
阅读次数:
3414
查准率 查准率 查准率(精度)是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献量与检出的文献总量的百分比。普遍表示为:查准率=(检索出的相关信息量/检索出的信息总量)x100%。使用专指性较强的检索语言(如上位类、上位主题词)能提高查准率,但查全率下降。 查全率 查全率 查全率(召回率), ...
分类:
其他好文 时间:
2018-11-25 16:18:34
阅读次数:
188
主题模型 主题模型这样理解一篇文章的生成过程: 1、 确定文章的K个主题。 2、 重复选择K个主题之一,按主题-词语概率生成词语。 3、 所有词语组成文章。 这里可以看到,主题模型仅仅考虑词语的数量,不考虑词语的顺序,所以主题模型是词袋模型。 主题模型有两个关键的过程: 1、 doc -> topi ...
分类:
其他好文 时间:
2018-10-05 21:04:33
阅读次数:
185
Python是一门近几年崛起很快也很火的编程语言。区别于我们国家大学里的第一门编程语言往往是C语言,Python则成为了国外本科学的入门级编程语言。同时随着科技的发展,拥有高容量、高速度和多样性的大数据已经成为当今时代的主题词。移动互联网、云计算、大数据的快速发展,使Python给开发者带来巨大的机 ...
分类:
编程语言 时间:
2018-07-04 16:03:31
阅读次数:
642