搜索关键字：词库，搜索到312个结果！码迷,mamicode.com！

描述使用Ubuntu 20.04自带的Intelligent Pinyin输入很难受，错字连篇，急需常用词汇！！！解决开启输入法Preference启用Dictionary后重启输入法候选词推荐精度显著提升！ ...

分类：系统相关时间：2021-06-18 18:57:43 阅读次数：0

1、jieba库基本介绍 (1)、jieba库概述 jieba是优秀的中文分词第三方库 -中文文本需要通过分词获得单个的词语 - jieba是优秀的中文分词第三方库，需要额外安装 - jieba库提供三种分词模式，最简单只需掌握一个函数 (2)、jieba分词的原理 Jieba分词依靠中文词库 - ...

分类：其他好文时间：2020-12-09 12:09:11 阅读次数：6

ES 实现实时从Mysql数据库中读取热词,停用词

IK分词器虽然自带词库但是在实际开发应用中对于词库的灵活度的要求是远远不够的,IK分词器虽然配置文件中能添加扩展词库,但是需要重启ES 这章就当写一篇扩展了其实IK本身是支持热更新词库的,但是需要我感觉不是很好词库热更新方案: 1:IK 原生的热更新方案,部署一个WEB服务器,提供一个Http ...

分类：数据库时间：2020-09-18 00:20:51 阅读次数：45

PHP FFI调用go，居然比go还快

上一篇文章中用PHP的FFI成功了调用了cjieba，但是速度实在是慢，4个函数循环调用20次，用了居然1分50多秒，而且C版本只比PHP快一点点，看来是cjieba本身慢了。这次发现了一个golang的分词库gse，试试导出为动态库，用FFI加载。碰到的问题不能导出go指针由于之前对cgo ...

分类：Web程序时间：2020-08-13 12:13:52 阅读次数：127

jieba和词云

1、jieba库基本介绍 (1)、jieba库概述 jieba是优秀的中文分词第三方库 - 中文文本需要通过分词获得单个的词语 - jieba是优秀的中文分词第三方库，需要额外安装 - jieba库提供三种分词模式，最简单只需掌握一个函数 (2)、jieba分词的原理 Jieba分词依靠中文词库 - ...

分类：其他好文时间：2020-07-04 01:18:52 阅读次数：87

布隆过滤器的基本原理和使用

工作中遇到一个需求，需要从词库中快速判断某个关键字是否存在，词库大小不超过百万，当时脑子第一反应是用hash表相关数据结构，和同事一交流，同事推荐用布隆过滤器，查询效率不输hashmap，而且非常节省存储空间。经过研究发现布隆过滤器挺好用的，这篇文章来说说三点： 1.什么是布隆过滤器。 2.布隆过滤 ...

分类：其他好文时间：2020-07-01 15:48:38 阅读次数：57

ORBSLAM2 添加二进制词库

参考: https://github.com/raulmur/ORB_SLAM2/pull/21/commits/4122702ced85b20bd458d0e74624b9610c19f8cc 然后编译 cd /home/jo/workspace/orb_demo/src/ORB_SLAM2 ch ...

分类：其他好文时间：2020-06-25 19:46:54 阅读次数：61

机器学习之单词拼写检查

在用户输入一个单词的时候，判断这个单词是否拼写错误，如果拼写错误，找到正确的单词并且返回。思路： 1.准备词库 2.判断一下输入的单词是否在词库中，如果在，输出 3.如果不在，找到与之相对的编辑距离为1的所有单词 4.遍历这些单词，并输出在吃苦中出现次数最多的单词中文单词拼写检查思路： 1.用所 ...

分类：其他好文时间：2020-06-25 11:30:22 阅读次数：51

django使用全文搜索引擎haystack+jieba分词

一、安装搜索框架、引擎、分词库 pip install whoosh django-haystack jieba 二、配置注册haystack框架：配置搜索引擎、索引文件路径、自动更新索引文件： HAYSTACK_CONNECTIONS = { 'default': { 'ENGINE': 'h ...

分类：其他好文时间：2020-06-18 01:57:29 阅读次数：89

IntroductionToNLP - ch02 - 2.2.2 词典的加载

from pyhanlp import * def load_dictionary(): """ 加载HanLP中的mini词库 :return: 一个set形式的词库 """ IOUtil = JClass('com.hankcs.hanlp.corpus.io.IOUtil') path = H ...

分类：其他好文时间：2020-06-17 23:47:36 阅读次数：83

共312条 1 2 3 4 ... 32 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)