码迷,mamicode.com
首页 >  
搜索关键字:文本挖掘    ( 132个结果
浅谈我对机器学习和文本挖掘的新的理解
转眼间已经工作了一段时间了,回想起2014年初学机器学习时的付出、艰苦和努力,感觉都是值得的。从现在往前看,我是沿着“计算机->统计学->数据分析->数据挖掘->机器学习->文本挖掘”的路径走过来的,我觉得这个思路还是属于比较传统的进阶方法,学习的内容有不少的冗余,但相对来说更稳健一些。今天写这篇文...
分类:其他好文   时间:2015-12-09 01:47:14    阅读次数:332
算法-综述
1、机器学习概论。 2、线性回归与Logistic。案例:电子商务业绩预测 3、岭回归,Lasso,变量选择技术。从一团乱麻中识别有用维度的技巧 4、降维技术。案例:业绩综合指标设计 5、线性分类器,Knn算法,朴素贝叶斯分类器,文本挖掘,案例:智能判断垃圾短信,通过文本挖掘给用户加标签,评论自动分...
分类:编程语言   时间:2015-11-26 01:23:58    阅读次数:240
R语言-文本挖掘 主题模型 文本分类
####需要先安装几个R包,如果有这些包,可省略安装包的步骤。#install.packages("Rwordseg")#install.packages("tm");#install.packages("wordcloud");#install.packages("topicmodels")例子中...
分类:编程语言   时间:2015-11-15 23:17:03    阅读次数:686
文本挖掘之文本聚类(MapReduce)
针对大数量的文本数据,采用单线程处理时,一方面消耗较长处理时间,另一方面对大量数据的I/O操作也会消耗较长处理时间,同时对内存空间的消耗也是很大,因此,本文引入MapReduce计算模型,以分布式方式处理文本数据,以期提高数据处理速率。本文结合Kmeans和DBSCAN算法,对上述算法进行改进,其中...
分类:其他好文   时间:2015-11-13 00:45:24    阅读次数:605
【项目总结】自然语言处理在现实生活中运用
摘要:自然语言处理或者是文本挖掘以及数据挖掘,近来一直是研究的热点。很多人相想数据挖掘,或者自然语言处理,就有一种莫名的距离感。其实,走进去你会发现它的美,它在现实生活中解决难题的应用之美,跟它相结合的数学之美,还有它与统计学的自然融合。语言只是一种实现工具,真正难度的是模型的理解和对模型的构建。本...
分类:编程语言   时间:2015-11-10 01:28:46    阅读次数:492
文本挖掘之文本聚类(OPTICS)
鉴于DBSCAN算法对输入参数,领域半径E和阈值M比较敏感,在参数调优时比较麻烦,因此本文对另一种基于密度的聚类算法OPTICS(Ordering Points To Identify the Clustering Structure)展开研究,其为DBSCAN的改进算法,与DBSCAN相比,该算法...
分类:其他好文   时间:2015-11-09 20:39:59    阅读次数:312
文本挖掘之文本推荐(子集合生成)
在研究文本推荐算法时,需要挖掘关键字之间的规则,其中比较重要的一步是构建关键字的集合,即需要求取一个集合的所有子集。因此本文根据需求,采用二叉树递归、位图和集合3种方式实现该算法,以期对后续算法研究提供帮助。
分类:其他好文   时间:2015-11-09 20:37:13    阅读次数:318
文本挖掘之文本聚类(DBSCAN)
鉴于基于划分的文本聚类方法只能识别球形的聚类,因此本文对基于密度的文本聚类算法展开研究。DBSCAN是一种典型的基于密度的聚类方法,可以找出形状不规则的聚类,而且聚类时无需事先知道聚类的个数。
分类:数据库   时间:2015-11-09 18:46:18    阅读次数:272
R语言做文本挖掘 Part2分词处理
Part2分词处理在RStudio中安装完相关软件包之后,才能做相关分词处理,请参照Part1部分安装需要软件包。参考文档:玩玩文本挖掘,这篇文章讲用R做文本挖掘很详尽,并且有一些相关资料的下载,值得看看!1. RWordseg功能说明文档可在http://download.csdn.net/det...
分类:编程语言   时间:2015-11-09 15:16:38    阅读次数:345
R语言做文本挖掘 Part3文本聚类
Part3文本聚类分类和聚类算法,都是数据挖掘中最常接触到的算法,分类聚类算法分别有很多种。可以看下下面两篇文章对常见的分类聚类算法的简介:分类算法:http://blog.csdn.net/chl033/article/details/5204220聚类算法:http://blog.chinaun...
分类:编程语言   时间:2015-11-09 13:56:14    阅读次数:1365
132条   上一页 1 ... 7 8 9 10 11 ... 14 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!