码迷,mamicode.com
首页 >  
搜索关键字:文本挖掘    ( 132个结果
文本挖掘案例
一、文本挖掘定义 文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类,前者是有监督的挖掘算法,后者是无监督的挖掘算法。 二、文本挖掘步骤 1)读取数据库或本地外部文本文件 2)文本分词 2.1)自定义字典 2.2)自定义停止 ...
分类:其他好文   时间:2017-04-01 15:49:48    阅读次数:291
文本挖掘——jieba分词
python 结巴分词(jieba)学习 特点 1,支持三种分词模式: a,精确模式,试图将句子最精确地切开,适合文本分析; b,全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; c,搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 ...
分类:其他好文   时间:2017-03-19 14:19:45    阅读次数:224
关于数据挖掘中的文本挖掘
文本挖掘, 顾名思义,就是挖掘本文信息中潜在的有价值的信息。文本数据与数值数据的区别有三: 第一,非结构化且数据量大; 文本数据的数据量是非常之巨大的,一百万条结构化数据可能才几十到几百兆,而一百万条文本数据就已经是GB了。当然文本数据的数据量无法与每天的log数据相比,但在基础数据中算是占比很大的 ...
分类:其他好文   时间:2017-01-26 01:01:24    阅读次数:592
R文本挖掘之jiebaR包
library(jiebaRD)library(jiebaR) ##调入分词的库cutter <- worker()mydata =read.csv(file.choose(),fileEncoding = 'UTF-8',stringsAsFactors = FALSE,header=FALSE) ...
分类:其他好文   时间:2017-01-24 14:44:56    阅读次数:329
大数据风控模型
基本流程: 数据收集、数据建模、构建数据画像、风险定价。 数据收集:网络行为数据、企业服务范围内行为数据、用户内容偏好数据、用户交易数据、授权数据源、第三方数据源、合作方数据源、公开数据源。 数据建模:文本挖掘、自然语言处理、机器学习、预测算法、聚类算法。 数据画像:基本属性、购买能力、行为特征、兴 ...
分类:其他好文   时间:2017-01-22 22:40:47    阅读次数:235
用GibbsLDA做Topic Modeling
http://weblab.com.cityu.edu.hk/blog/luheng/2011/06/24/%E7%94%A8gibbslda%E5%81%9Atopic-modeling/#comment-87 Topic Modeling是一种文本挖掘的方法。将文本视作一个由许多许多词组成的数据 ...
分类:其他好文   时间:2016-12-22 14:18:50    阅读次数:223
使用文本挖掘实现站点个性化推荐
作者:韦玮,重庆韬翔网络科技有限公司(上海)董事长兼总经理,IT作家,CSDN社区专家。  本文为韦玮原创文章,未经允许不得转载,点此查看作者有关《Python数据分析与挖掘经典案例实战》经验分享。...
分类:其他好文   时间:2016-12-16 12:11:40    阅读次数:431
< 独立项目 - 文本挖掘 > - 2016/11/13 第二更 - <Python环境准备>
< 独立项目 - 文本挖掘 > 项目立项的相关背景介绍,TODO方向。 一、Ubuntu环境配置 主机系统:Windows 7 SP1 64位操作系统 | i5-4210 CPU | 16GB RAM VirtualBox虚拟环境:GUN VitrualBox Linux系统:Ubuntu 15.1 ...
分类:编程语言   时间:2016-11-15 08:04:36    阅读次数:161
< 独立项目 - 文本挖掘 > - 2016/10/25 第一更 - <Linux相关知识准备>
< 独立项目 - 文本挖掘 > 项目立项的相关背景介绍,TODO方向。 一、Ubuntu环境配置 主机系统:Windows 7 SP1 64位操作系统 | i5-4210 CPU | 16GB RAM VirtualBox虚拟环境:GUN VitrualBox Linux系统:Ubuntu 15.1 ...
分类:系统相关   时间:2016-11-14 01:32:29    阅读次数:310
重磅︱文本挖掘深度学习之word2vec的R语言实现
笔者寄语:2013年末,Google发布的 word2vec工具引起了一帮人的热捧,大家几乎都认为它是深度学习在自然语言领域的一项了不起的应用,各种欢呼“深度学习在自然语言领域开始发力 了”。 基于w...
分类:编程语言   时间:2016-10-31 22:19:25    阅读次数:338
132条   上一页 1 ... 4 5 6 7 8 ... 14 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!