码迷,mamicode.com
首页 >  
搜索关键字:词库    ( 312个结果
全文检索-Lucene.net
例子的组件版本 Lucene.Net:3.0.3.0 盘古分词:2.4.0.0 分词例子 分词是核心算法,将完整的句子分词成若干个词或字;同时它只能处理文本信息,非文本信息只能转换成为文本信息,无法转换的只能放弃。 所有供全文搜索的要先写入索引库,索引库可以看成存放数据的数据库 搜索对象建立的时候( ...
分类:Web程序   时间:2018-05-10 00:32:12    阅读次数:189
淘宝关键词提取:换个姿势看同行都在用的高流量高搜索热词
同行的卖家哪些词用的多,往往这些词搜索量也大。有些我们想不出来的词,其他卖家想到了,那么就可以通过提取,列出来供我们自己使用。 举个粟子,我们准备上架一款打底裤产品,需要一些相关的买家搜索量大、点选量高的词用来组合标题、优化直通车等用途。店长自己想了十几个自己觉得不错的词,想用在标题上。但是不确定这 ...
分类:其他好文   时间:2018-05-09 22:33:07    阅读次数:639
HanLP用户自定义词典源码分析
HanLP用户自定义词典源码分析 1. 官方文档及参考链接 关于词典问题Issue,首先参考: "FAQ" 自定义词典其实是基于 规则 的分词,它的用法参考 "这个issue" 如果有些数量词、字母词需要分词,可参考: "P2P和C2C这种词没有分出来,希望加到主词库" 关于词性标注:可参考 "词性 ...
分类:其他好文   时间:2018-05-04 21:26:48    阅读次数:579
Python第三方库____jieba
jieba是优秀的中文分词第三方库 中文文本需要通过分词获得单个词语 jieba是优秀的中文分词第三方库,需要额外安装 (pip install jieba) jieba库提供三种分词模式,最简单只需掌握一个函数 jieba分词原理 利用一个中文词库,确定汉字之间的关系概率 汉字之间概率大的组成词组 ...
分类:编程语言   时间:2018-05-01 23:27:12    阅读次数:468
Lucence
1、关键字检索的第一步是对整个文档分词 英文 空格 中文 中文词库配合中文分词法 中文分词有IK和庖丁,直接配置就可以使用 2、lucence的开源项目 --lucence core:java编写的核心类库,提供了全文检索功能的底层API与SDK --Solr:基于lucence core开发的高性 ...
分类:其他好文   时间:2018-04-28 19:42:03    阅读次数:235
微信背单词类小程序,小鸡单词源码下载,打卡微信小程序
微信背单词类小程序,小鸡单词源码下载,微信小程序开发学习案例,小程序开发教程。一个用来背单词每天打卡的微信小程序,还有词汇测试,包含多种词库后台由腾讯云wafer解决方案。 前段时间开始学做微信小程序,花了半个月时间算是入门了个人感觉学习还是挺快的,写了一个背单词打开的小程序,大概十几个页面本文介绍 ...
分类:微信   时间:2018-04-24 20:19:51    阅读次数:571
python结巴分词
转载: http://www.cnblogs.com/jiayongji/p/7119065.html 结巴是一个功能强大的分词库。 安装jieba pip install jieba 简单用法 结巴分词分为三种模式:精确模式(默认)、全模式和搜索引擎模式,下面对这三种模式分别举例介绍: 精确模式 ...
分类:编程语言   时间:2018-04-24 17:26:45    阅读次数:361
看到一个词语提取小工具,分享给有标签、词库需求的同学们
关于词语小工具的描述快戳下面链接~~~https://forum.huaweicloud.com/thread-8391-1-1.html不想看文章,想立即试用小工具的,请戳下面~~~http://fe2e6fd859034d40a3269f7b541e31de.apigw.cn-north-1.huaweicloud.com/
分类:其他好文   时间:2018-04-24 11:50:19    阅读次数:140
软件测试第六周作业
一、计划说明 1.产品介绍 市面上有许多的帮助背单词的APP,本小组针对其中的两款软件进行软件的测试和评估,分别为“百词斩”和“扇贝单词”。两者都具有较完备的业务功能,在以学生为主要受众的用户群体中比较受欢迎。本小组选取两者兼具的四项功能(背诵模块、商城模块、听力阅读模块、词库管理)进行测试,分析各 ...
分类:其他好文   时间:2018-04-23 11:11:33    阅读次数:186
Python中文分词 jieba
三种分词模式与一个参数 以下代码主要来自于jieba的github,你可以在github下载该源码 关键词提取 运行结果如图所示,但是同样的我们也发现了一些问题,比如: 问题一: 分词错误,在运行结果中中”路明非”(龙族男主)被分成了”路明”和”明非”啷个中文词语,这是因为jieba的词库中并不含有 ...
分类:编程语言   时间:2018-04-14 20:44:09    阅读次数:529
312条   上一页 1 ... 9 10 11 12 13 ... 32 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!