搜索关键字：分词，搜索到2158个结果！码迷,mamicode.com！

大数据---单词释义

external 外部的；表面的；[药] 外用的；外国的；外面的 delimited v. 划定…的界限；限定（delimit的过去分词） adj. 划定界限的；被限定了的 terminated ['t?m?,net] v. 终止；结束；终结（terminate的过去分词） adj. 终止的；有限的 ...

分类：其他好文时间：2018-04-03 19:21:08 阅读次数：176

NLPIR语义智能平台支持大数据个性化学习

NLPIR能够全方位多角度满足应用者对大数据文本的处理需求，包括大数据完整的技术链条：网络抓取、正文提取、中英文分词、词性标注、实体抽取、词频统计、关键词提取、语义信息抽取、文本分类、情感分析、语义深度扩展、繁简编码转换、自动注音、文本聚类等。 ...

分类：其他好文时间：2018-04-03 17:17:07 阅读次数：164

文本分类学习（三）特征权重（TF/IDF）和特征提取

上一篇中，主要说的就是词袋模型。回顾一下，在进行文本分类之前，我们需要把待分类文本先用词袋模型进行文本表示。首先是将训练集中的所有单词经过去停用词之后组合成一个词袋，或者叫做字典，实际上一个维度很大的向量。这样每个文本在分词之后，就可以根据我们之前得到的词袋，构造成一个向量，词袋中有多少个词，那这个 ...

分类：其他好文时间：2018-04-03 14:24:41 阅读次数：457

lucene_07_solr使用IK分词器

使用IKAnalyzer 中文分析器。. 第一步: 把,IKAnalyzer2012FF_u1j 添加到sol/WEB-INF/lib 目录下。第二步: 复制IKAnalyzer 的配置文件和自定义词典和停用词词典到solr 的classpath （classes），即solr\WEB-INF\c ...

分类：Web程序时间：2018-04-03 10:54:31 阅读次数：201

lucene_02_IKAnalyre

前言在lucene中虽然已经提供了许多的分词器：StandardAnalyzer、CJKAnalyzer等，但在解析中文的时候都会把文中拆成一个个的单子。毕竟老外不懂中文。这里介绍一个中文的分词器：IKAnalyre。虽然在其在分词的时候还不够完美例如：将“高富帅，是2012年之后才有的词汇” ...

分类：Web程序时间：2018-03-30 16:21:19 阅读次数：198

中文词频

下载一长篇中文文章。从文件读取待分析文本。 news = open('gzccnews.txt','r',encoding = 'utf-8') 安装与使用jieba进行中文分词。 pip install jieba import jieba list(jieba.lcut(news)) 生成词频 ...

分类：其他好文时间：2018-03-29 00:05:39 阅读次数：142

综合练习：词频统计

1.英文词频统下载一首英文的歌词或文章将所有,.？！’:等分隔符全部替换为空格将所有大写转换为小写生成单词列表生成词频统计排序排除语法型词汇，代词、冠词、连词输出词频最大TOP20 1.英文词频统下载一首英文的歌词或文章将所有,.？！’:等分隔符全部替换为空格将所有大写转换为小 ...

分类：其他好文时间：2018-03-29 00:04:20 阅读次数：151

综合练习：词频统计

1.英文词频统下载一首英文的歌词或文章将所有,.？！’:等分隔符全部替换为空格将所有大写转换为小写生成单词列表生成词频统计排序排除语法型词汇，代词、冠词、连词输出词频最大TOP20 将分析对象存为utf-8编码的文件，通过文件读取的方式获得词频分析内容。 2.中文词频统计下载一长篇 ...

分类：其他好文时间：2018-03-28 23:57:44 阅读次数：322

综合练习：词频统计

1.英文词频统计下载一首英文的歌词或文章将所有,.？！’:等分隔符全部替换为空格将所有大写转换为小写生成单词列表生成词频统计排序排除语法型词汇，代词、冠词、连词输出词频最大TOP20 将分析对象存为utf-8编码的文件，通过文件读取的方式获得词频分析内容。 2.中文词频统计下载一长 ...

分类：其他好文时间：2018-03-28 23:55:22 阅读次数：188

英文句子相似性判断

1.要求本次项目提供一系列的英文句子对，每个句子对的两个句子，在语义上具有一定的相似性；每个句子对，获得一个在0-5之间的分值来衡量两个句子的语义相似性，打分越高说明两者的语义越相近。如： 2.基本实现过程 2.1 数据处理：（1）分词：（2）去停用词：停用词是一些完全没有用或者没有意义的 ...

分类：其他好文时间：2018-03-28 21:59:21 阅读次数：249

共2158条上一页 1 ... 82 83 84 85 86 ... 216 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)