新闻标签提取的评价方法 一、 目标: 用于评价不同的标签提取算法的优劣,以及算法中参数选取的效果评价。 二、 困难: 标签提取效果的好坏具有强烈的主观性,对一条新闻提取标签的价好坏,通过机器来做的话,比较困难。 三、 解决方案: 选取一定数量的新闻集,经过标签提取得到标签集,通过比较标签集的分布,来 ...
分类:
其他好文 时间:
2017-06-10 12:33:04
阅读次数:
162
基于TF-IDF的新闻标签提取 1. 新闻标签 新闻标签是一条新闻的关键字,可以由编辑上传,或者通过机器提取。新闻标签的提取主要用于推荐系统中,所以,提取的准确性影响推荐系统的有效性。同时,对于将标签展示出来的新闻网站,标签的准确性也会影响用户体验。 2. 新闻标签提取算法 新闻首先是一段文本,新闻 ...
分类:
其他好文 时间:
2017-06-07 18:52:23
阅读次数:
178
肺结节的特征提取在临床中有着重要应用,在上篇文章已经对肺结节的基本特征和CT影像特征提取算法有了介绍,提出了三类肺结节CT影像特征提取算法。本文重点介绍肺结节CT影像特征提取系统的功能介绍及使用,利用肺结节CT影像特征提取系统对一些数据进行特征提取,检验特征提取算法的有效性。
...
分类:
其他好文 时间:
2017-06-03 12:58:36
阅读次数:
346
医学图像特征提取可以认为是基于图像内容提取必要特征,医学图像中需要什么特征基于研究需要,提取合适的特征。相对来说,医学图像特征提取要求更加高,因为对医生的辅助诊断起着至关重要的作用,所以需要严谨可靠的特征。肺结节CT影像特征提取也是属于医学图像特征提取领域的一个部分,有着医学图像特征提取的基本要求。... ...
分类:
编程语言 时间:
2017-06-02 22:59:19
阅读次数:
350
转自:http://www.afenxi.com/post/18593 摘要: 机器学习牵涉的编程语言十分之广,包括了MATLAB、Python、Clojure、Ruby等等。为了让开发者更加广泛、深入地了解机器学习,云栖社区组织翻译了GitHub Awesome Machine Learning ...
分类:
其他好文 时间:
2017-04-02 22:00:21
阅读次数:
382
SimHash是什么 SimHash是Google在2007年发表的论文《Detecting Near-Duplicates for Web Crawling 》中提到的一种指纹生成算法或者叫指纹提取算法,被Google广泛应用在亿级的网页去重的Job中,作为locality sensitive h ...
分类:
编程语言 时间:
2017-03-14 18:38:49
阅读次数:
386
参考文章链接: http://www.cnblogs.com/jasondan/p/3497757.html http://d.wanfangdata.com.cn/Patent/CN201410007832.6/ 基于网页分析构思出的正文提取算法 回顾以上的网页分析,如果按照文本密度来找提取正文, ...
分类:
编程语言 时间:
2016-12-07 20:36:42
阅读次数:
370
在文本分类的学习过程中,在“如何衡量一个关键字在文章中的重要性”的问题上,遇到了困难。在网上找了很多资料,大多数都提到了这个算法,就是今天要讲的TF-IDF。 总起 TF-IDF,听起来很高大上啊,其实理解起来相当简单,他实际上就是TF*IDF,两个计算值的乘积,用来衡量一个词库中的词对每一篇文档的 ...
分类:
编程语言 时间:
2016-11-05 17:32:41
阅读次数:
185
因项目上需要用到特征提取算法,突然想起早些时候看吴军的数学之美里有讲到SVD分解,当时就大致浏览了下,今天在这里用图像作为例子加深下印象,显示下svd特征提取、降维效果。 奇异值分解(Singular Value Decomposition)定理:设A为m*n阶复矩阵,则存在m阶酉阵U和n阶酉阵V, ...
分类:
其他好文 时间:
2016-10-19 13:54:07
阅读次数:
193
原文链接:http://www.cnblogs.com/cfantaisie/archive/2011/06/14/2080917.html 主要步骤 1)、尺度空间的生成; 2)、检测尺度空间极值点; 3)、精确定位极值点; 4)、为每个关键点指定方向参数; 5)、关键点描述子的生成。 L(x,y... ...
分类:
编程语言 时间:
2016-07-13 13:55:11
阅读次数:
245