码迷,mamicode.com
首页 >  
搜索关键字:分词    ( 2158个结果
Elasticsearch系列---多字段搜索
了解一下多字段搜索的场景,和要注意的细节点,精准搜索是一个非常大的话题,优化的空间没有上限,可以先从最基础的场景和调整语法开始尝试。 ...
分类:其他好文   时间:2020-03-22 10:36:41    阅读次数:77
项目报告(一)
今天采用jieba分词,和kmains算法对数据库中的关键词进行了切分以及矩阵化,并且通过算法对其进行了聚类 最终聚类的结果为:(第一行代表的是关键词的行数,第二行代表所划分的类) 然后对用一个树图的形式,对数据进行了可视化展示 结果如图: ...
分类:其他好文   时间:2020-03-20 20:37:35    阅读次数:66
ES快速入门,ElasticSearch 搜索引擎
3 ES快速入门 ES作为一个索引及搜索服务,对外提供丰富的REST接口,快速入门部分的实例使用head插件来测试,目的是对ES的使用方法及流程有个初步的认识。 3.1 创建索引库 ES的索引库是一个逻辑概念,它包括了分词列表及文档列表,同一个索引库中存储了相同类型的文档。它就相当于MySQL中的表 ...
分类:其他好文   时间:2020-03-15 17:34:30    阅读次数:603
pyltp库的使用进行文本分析
pyltp目前支持puthon3.6不支持3.7 用python3.7安装了很久都没有安装成功 无奈换成了3.6 分句 from pyltp import SentenceSplitter sents = SentenceSplitter.split('元芳你怎么看?我就趴窗口上看呗!') # 分句 ...
分类:其他好文   时间:2020-03-15 11:42:13    阅读次数:82
23 情态动词+完成时
情态动词+完成时 (1)“情态动词+have + done过去分词.” a. 表达过去事实。 b. 推测的含义,比如可能已经这样,或者一定这样了。表猜测 (但助动词should例外)。 1. He can/could have arrived. 他可能已经到了。 2. He may/might ha ...
分类:其他好文   时间:2020-03-14 23:38:29    阅读次数:72
Handlp 分词、加词典、关键字提取、摘要、短语提取、依法依据分析(含代码、直接运行即可)
简单分词: 1 from pyhanlp import * 2 content = "现如今,机器学习和深度学习带动人工智能飞速的发展,并在图片处理、语音识别领域取得巨大成功。" 3 Get_value=HanLP.segment(content) 4 print(Get_value) 输出: 加词 ...
分类:其他好文   时间:2020-03-14 18:38:54    阅读次数:109
开发进度 02
今天获取到了地区的行政划分,已经行政代码,并将其存入到数据库 将创新成果的名称进行分词,提取关键词,存储到数据库,行业代码还没有搞定 关键词: 地域信息及行政代码 ...
分类:其他好文   时间:2020-03-13 20:50:37    阅读次数:48
19 完成时/现在完成时和过去完成时的区别
完成时 (1)现在完成时(have/has + done过去分词),动作过去发生,已经完成,对现在造成影响或后果,动作可能还会持续,可使用的时间状语为: already(已经) 和 yet(还)。 They have already arrived in Shanghai. 他们已经到达上海了。 a ...
分类:其他好文   时间:2020-03-13 01:49:48    阅读次数:146
python统计word文档中的词频
如何将统计word文档中的词频呢?先用docx模块将word文档转变成txt格式,然后使用jieba模块进行分词,并统计词频。是不是很简单~#2020年3月10日#ElizabethfromdocximportDocumentimportjieba#分词模块#自定义函数,将word文档写入txt文档defto_txt(path):document=Document(path)txt=open(‘/
分类:编程语言   时间:2020-03-10 23:29:42    阅读次数:99
中文分词(三):关键词提取
本文介绍一些常用的无监督关键词提取算法:TF-IDF,TextRank,主题模型算法 一、TF-IDF算法 即词频-逆文档频次算法,其基本思想是想要找到这样的词:它在一篇文档中出现的频次高(TF),即说明这篇文档很有可能围绕这个词进行说明;但是并不在多篇文档中出现(IDF),即说明这个词对文档的区分 ...
分类:其他好文   时间:2020-03-10 21:55:57    阅读次数:173
2158条   上一页 1 ... 16 17 18 19 20 ... 216 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!