换了win10后,极点就不好用了,看上了自定义更强的小狼毫,太难掌控了,只能先用点皮毛。 目前的理解,感觉很有特色的就是能根据候选项自定义提示内容,并且还能用Ctrl-Shift-Enter上屏提示内容 比如我自定义了个词组indirect,并设置了其提示内容为Excel公式:indirect("$ ...
分类:
其他好文 时间:
2020-03-27 00:40:42
阅读次数:
65
本文将介绍在springboot中整合solr。 1、前提约束 完成solr中的分词、停词以及扩展词库配置 https://www.jianshu.com/p/0e6f4f4a6505 2、操作步骤 创建一个springboot项目 https://www.jianshu.com/p/de979f5 ...
分类:
编程语言 时间:
2020-03-26 21:19:32
阅读次数:
69
Sphinx的安装和使用 sphinx的使用两种方式: 1、使用sphinx的API来操作sphinx,PHP中将API编译到PHP中作为扩展 2、使用mysql的sphinx的存储引擎 sphinx是英文的全文检索引擎,coreseek是支持中文词库的全文检索引擎,Lucene是用java实现的全 ...
分类:
其他好文 时间:
2020-03-14 17:04:58
阅读次数:
61
聚合页技术是什么? 通过关键词去站内搜索出一些结果做成SEO友好的静态化页面。在聚合页面之间需要做一些内链,形成链轮,便于搜索引擎蜘蛛爬取,且在网站高权重页面增加链接入口,以吸引蜘蛛前来爬取页面的一种SEO技术方式。 聚合页技术可快速增加成倍页面数量与收录量? 这是一种被广泛验证的SEO技术了,各种 ...
分类:
Web程序 时间:
2020-02-09 18:09:04
阅读次数:
143
由于项目需要,使用jieba分词库 点击项目,默认设置,选择项目翻译点击右侧 + , 查询jieba ,点击左下角安装 还有一个放法(此方法未使用) 首先上githup下载jieba分词库 然后加压到任意目录 打开cmd命令行窗口并切换到jieba目录下 运行python setup.py inst ...
分类:
编程语言 时间:
2020-02-07 20:46:34
阅读次数:
86
1. 概述 1. 微软拼音输入法 下, 自定义 时间日期格式 1. 这个功能, 让我真正见识到了, 什么是 鸡肋 2. 背景 1. 因为 cpu 和 内存占用的原因, 我换掉了 qq拼音输入法 2. 至于替代品, 我选择了 win10 自带的 微软拼音 3. 但是也遇到了些问题 1. 微软拼音自带的 ...
分类:
其他好文 时间:
2020-02-07 15:15:43
阅读次数:
90
安装jieba:pip install jieba 原理: 基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图 (DAG) 采用了动态规划查找最大概率路径, 找出基于词频的最大切分组合 对于未登录词,采用了基于汉字成词能力的 HMM 模型,使用了 Viterbi 算法 ...
分类:
编程语言 时间:
2020-02-02 19:34:51
阅读次数:
263
jieba简介 jieba库是一个简单实用的中文自然语言处理分词库。 jieba分词属于概率语言模型分词。概率语言模型分词的任务是:在全切分所得的所有结果中求某个切分方案S,使得P(S)最大。 jieba支持三种分词模式: 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧 ...
分类:
其他好文 时间:
2020-02-02 19:31:12
阅读次数:
108
【前言】从前年的时候,我都在心里有个想法。我想自己做一套搜索功能。在心里我是这么想的:1、有个资源信息库,供我查询,这个资源库可能包含各种途径生成的统一格式的数据库。2、查询时,我先整段匹配资源库找到资源。3、接下来就是分词了,这里我联想到了一些输入法的细胞词库。也就是说能不能按照细胞词库先匹配我们的搜索内容,然后将分词后的搜索条件进行匹配查询。4、按照匹配度的高低进行排序。直到昨天,在工作中刚刚
分类:
Web程序 时间:
2020-01-31 16:09:51
阅读次数:
101
2020年过年期间,由于冠状病毒肺炎的流行,在家无事,就把搁置了很久的词库进行了改进。发布了2.7版:https://github.com/studyzy/imewlconverter/releases/tag/v2.7.0 转眼深蓝词库转换从诞生到现在都已经10个年头了,这是我做的最久的软件了。本 ...
分类:
系统相关 时间:
2020-01-29 23:40:17
阅读次数:
515