分词器概念介绍: Analyzer类(分词器)就是把一段文本中的词按某些规则取出,提供和以后查询时使用的工具类,注意在创建索引时会用到分词器,在使用字符串搜索时也会用到分词器,这两个地方要使用同一个分词器,否则可能会搜索不出结果 分词器工作流程: 1, 切分关键词 2, 去除停用词 3, 对于英文单 ...
分类:
Web程序 时间:
2018-12-10 18:13:21
阅读次数:
243
万恶的源头 HelloWorld 要完成lucene 的配置 需要几个jar包 (如果需要可以留言我私发) 创建索引API分析: 1. Directory: 类代表一个Lucene索引的位置,FSDirectory:它表示一个存储在文件系统中的索引的位置 2. Analyzer 类是一个抽象类, 它 ...
分类:
Web程序 时间:
2018-12-07 20:54:45
阅读次数:
212
查看 webpack 打包后所有组件与组件间的依赖关系,针对多余的包文件过大, 剔除首次影响加载的效率问题进行剔除修改,本次采用的是 ==webpack-bundle-analyzer(可视化视图查看器)== == 介绍1:webpack-bundle-analyzer(可视化)== 将捆绑内容表示 ...
分类:
Web程序 时间:
2018-11-30 15:34:53
阅读次数:
303
一、分析各模块打包后大小 用vue cli创建的项目,已经集成 webpack bundle analyzer。详见文件 build/webpack.prod.conf.js,代码如下: 运行npm run build report后,会提示: 在该网址上可查看详细信息。 二、发现项目里打包后比较大 ...
分类:
其他好文 时间:
2018-11-06 19:41:39
阅读次数:
221
本文转之:https://blog.csdn.net/rachel_luo/article/details/8992461 前言 性能分析工具之-- Eclipse Memory Analyzer tool(MAT)(一)中介绍了内存泄漏的前因后果。在本文中,将介绍MAT如何根据heapdump分析 ...
分类:
系统相关 时间:
2018-11-01 17:02:42
阅读次数:
320
编译程序的核心组件 lexical analyzer syntax analyzer semantic analyzer intermediate code generator machine independent code optimizer code generator machine dep ...
分类:
其他好文 时间:
2018-11-01 01:07:22
阅读次数:
152
该文使用 Centos6.5 64 位 solr4.10.3 IK-Analyzer中文分析器 一、solr域 在solr中域的概念与lucene中域的概念相同,数据库的一条记录或者一个文件的信息就是一个document,数据库记录的字段或者文件的某个属性就是一个Field域,solr中对索引的检索 ...
分类:
其他好文 时间:
2018-10-31 17:06:40
阅读次数:
316
软件简介 THULAC(THU Lexical Analyzer for Chinese)由清华大学自然语言处理与社会人文计算实验室研制推出的一套中文词法分析工具包,具有中文分词和词性标注功能。THULAC具有如下几个特点: 能力强。利用我们集成的目前世界上规模最大的人工分词和词性标注中文语料库(约 ...
分类:
其他好文 时间:
2018-10-31 12:35:48
阅读次数:
215
一.官网提供的Elasticsearch的Python接口包 1.github地址:https://github.com/elastic/elasticsearch-dsl-py 2.安装:pip install elasticsearch-dsl 3.有很多api,使用可参考github中的文档 ...
分类:
其他好文 时间:
2018-10-30 21:17:16
阅读次数:
754
Java virtual machine [TOC] 内存溢出: 拍照,设置程序初始化时内存栈大小,和程序最大的内存栈大小 Idea下载Memory Analyzer的插件来查看拍照得到的文件,看是哪个object占用的内存最多。 Java技术体系:Java程序设计语言, 个硬件平台上的Java虚拟 ...
分类:
编程语言 时间:
2018-10-29 20:08:45
阅读次数:
213