1. 获取 ES-IKAnalyzer插件 一定和ES的版本一致( 7.8.1) 地址: https://github.com/medcl/elasticsearch-analysis-ik/releases 1 //解压zip文件到指定文件夹unzip elasticsearch-analysis ...
分类:
其他好文 时间:
2020-08-18 15:41:29
阅读次数:
88
上一篇文章中用PHP的FFI成功了调用了cjieba,但是速度实在是慢,4个函数循环调用20次,用了居然1分50多秒,而且C版本只比PHP快一点点,看来是cjieba本身慢了。 这次发现了一个golang的分词库gse,试试导出为动态库,用FFI加载。 碰到的问题 不能导出go指针 由于之前对cgo ...
分类:
Web程序 时间:
2020-08-13 12:13:52
阅读次数:
127
功能 1、整理近5年软工毕业设计(论文)的基础信息(作者、题目、摘要、关键词、论文类型、指导教师等)。 2、通过自然语言处理,对论文题目进行分词,对热点词汇绘制标签云。 3、实现针对关键词热度随时间迁移的趋势变化分析。 4、开展针对某一主题的毕业论文知识图谱可视化分析。 5、对指导教师等其他信息进行 ...
分类:
编程语言 时间:
2020-08-05 14:28:27
阅读次数:
173
下载eslasticSearch(本次使用6.5.4的windows版本) https://www.elastic.co/cn/downloads/past-releases 下载ik中文分词器(对应es的版本 下载zip) https://github.com/medcl/elasticsearc ...
分类:
其他好文 时间:
2020-08-01 12:35:01
阅读次数:
94
1、问题抛出来自星友的一个真实业务场景问题:我现在的业务需求是这样的。有一个作者字段,比如是这样的Li,LeiLei;Han,MeiMei;还有一些是LeiLeiLi...。现在要精确匹配。我的想法是:用自定义分词通过分号分词。但是这样我检索Li,LeiLei那么LeiLeiLi就不能搜索到,我希望的结果是LeiLeiLi也被搜索到。而且这种分词,Li,LeiLei不加逗号,也不能匹配到。但是不知
分类:
其他好文 时间:
2020-08-01 12:33:36
阅读次数:
68
DockerFile构建ElasticSearch镜像安装IK中文分词器插件 为什么要安装IK中文分词器? ES提供的分词是英文分词,对中文做分词时会拆成单字而不是词语,非常不好,因此索引信息含中文时需要使用中文分词器插件。 一、环境及文件准备 环境准备 VMWare版本:15.5.5 操作系统:C ...
分类:
其他好文 时间:
2020-07-29 17:44:12
阅读次数:
85
Elasticsearch中当我们设置Mapping(分词器、字段类型)完毕后,就可以按照设定的方式导入数据。
分类:
其他好文 时间:
2020-07-27 23:37:15
阅读次数:
70
@ 状语从句的连接词 独立结构(独立主格) 如果有be动词,谓语变身过程中丢掉be动词,本质就是变成了分词结构 例子 主语一直主动 When I was a little girl, I fell in love with science. Being a little girl, I fell i ...
分类:
其他好文 时间:
2020-07-26 19:38:19
阅读次数:
115
Python第三方库 jieba - 分词 matplotlib - 绘图 PIL - 图片处理 numpy - 矩阵运算 sqlite3 - sqlite数据库 Flask - web框架 urllib - URL处理,网页爬虫 bs4 - 解析文档-html re - 正则表达式,文字匹配 xl ...
分类:
编程语言 时间:
2020-07-18 15:31:09
阅读次数:
65
1,讲分词器的文件夹放入es安装包的plugins,重新启动elasticsearch //查询es运行中的进程pid ps -aux|grep elasticsearch //杀死进程 kill -9 pid //使用es账户启动 nohup ./elasticsearch & 2,重启es,然后 ...
分类:
其他好文 时间:
2020-07-17 19:24:23
阅读次数:
67