码迷,mamicode.com
首页 >  
搜索关键字:ik analyzer 2012 u5    ( 937个结果
elasticsearch安装IK分词插件
一 打开网页:https://github.com/medcl/elasticsearch-analysis-ik/releases 这个是ik相关的包,找到你想下载的版本,下载对应的zip包 二 然后在安装目录的plugins中新建ik文件夹, 然后将文件解压到当前文件夹,对应的ik文件夹如下图所 ...
分类:其他好文   时间:2018-11-28 15:39:53    阅读次数:206
Elasticsearch拼音分词和IK分词的安装及使用
一、Es插件配置及下载 1.IK分词器的下载安装 关于IK分词器的介绍不再多少,一言以蔽之,IK分词是目前使用非常广泛分词效果比较好的中文分词器。做ES开发的,中文分词十有八九使用的都是IK分词器。 下载地址:https://github.com/medcl/elasticsearch-analys ...
分类:其他好文   时间:2018-11-25 13:26:39    阅读次数:294
【Docker系列】认识ELK,docker安装ELK和IK分词器
1.ELK简介ELK是三个开源软件的缩写,分别表示:Elasticsearch,Logstash,Kibana,它们都是开源软件。新增了一个FileBeat,它是一个轻量级的日志收集处理工具(Agent),Filebeat占用资源少,适合于在各个服务器上搜集日志后传输给Logstash,官方也推荐此工具。Elasticsearch是个开源分布式搜索引擎,提供搜集、分析、存储数据三大功能。它的特点有
分类:其他好文   时间:2018-11-22 00:24:48    阅读次数:189
解决:xml中出现“文档中根元素后面的标记必须格式正确。”的错误
配置业务域,type指定使用自定义的fieldType。 修改solr工程下的schema.xml文件,在文件末尾添加一个自定义的fieldType,如下: <schema>............</schema> <fieldType name="text_ik" class="solr.Tex ...
分类:其他好文   时间:2018-11-21 15:36:33    阅读次数:372
和我一起打造个简单搜索之IK分词以及拼音分词
elasticsearch 官方默认的分词插件,对中文分词效果不理想,它是把中文词语分成了一个一个的汉字。所以我们引入 es 插件 es ik。同时为了提升用户体验,引入 es pinyin 插件。本文介绍这两个 es 插件的安装。 <! more 环境 本文以及后续 es 系列文章都基于 5.5. ...
分类:其他好文   时间:2018-11-15 23:14:43    阅读次数:421
一次vue-cli 2.x项目打包优化经历(优化xlsx插件)
一、分析各模块打包后大小 用vue cli创建的项目,已经集成 webpack bundle analyzer。详见文件 build/webpack.prod.conf.js,代码如下: 运行npm run build report后,会提示: 在该网址上可查看详细信息。 二、发现项目里打包后比较大 ...
分类:其他好文   时间:2018-11-06 19:41:39    阅读次数:221
eclipse memory analyzer对系统内存溢出堆文件解析(转)
本文转之:https://blog.csdn.net/rachel_luo/article/details/8992461 前言 性能分析工具之-- Eclipse Memory Analyzer tool(MAT)(一)中介绍了内存泄漏的前因后果。在本文中,将介绍MAT如何根据heapdump分析 ...
分类:系统相关   时间:2018-11-01 17:02:42    阅读次数:320
编译原理
编译程序的核心组件 lexical analyzer syntax analyzer semantic analyzer intermediate code generator machine independent code optimizer code generator machine dep ...
分类:其他好文   时间:2018-11-01 01:07:22    阅读次数:152
solr学习之域的管理与中文分析器配置
该文使用 Centos6.5 64 位 solr4.10.3 IK-Analyzer中文分析器 一、solr域 在solr中域的概念与lucene中域的概念相同,数据库的一条记录或者一个文件的信息就是一个document,数据库记录的字段或者文件的某个属性就是一个Field域,solr中对索引的检索 ...
分类:其他好文   时间:2018-10-31 17:06:40    阅读次数:316
一套准确率高且效率高的分词、词性标注工具-thulac
软件简介 THULAC(THU Lexical Analyzer for Chinese)由清华大学自然语言处理与社会人文计算实验室研制推出的一套中文词法分析工具包,具有中文分词和词性标注功能。THULAC具有如下几个特点: 能力强。利用我们集成的目前世界上规模最大的人工分词和词性标注中文语料库(约 ...
分类:其他好文   时间:2018-10-31 12:35:48    阅读次数:215
937条   上一页 1 ... 23 24 25 26 27 ... 94 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!