之前srcum没写好是我的错。以后会每天更新的。老师反映之前项目小组从pdf中提取作者效果不好,我们讨论决定进行一定的优化。在整合测试的同时开始服务器程序部署。 MemberToday’s taskNext task林豪森协助测试及服务器部署协助测试及服务器部署宋天舒整合测试分词算法服务器程序部.....
分类:
其他好文 时间:
2014-11-13 16:28:51
阅读次数:
121
今天apec最后一天,大部分任务都差不多了,局部测试问题不大。大家修复下小细节就可以开始整合了。 MemberToday’s taskNext task林豪森协助测试及服务器部署协助测试及服务器部署宋天舒修复发现的分词算法bug整合测试分词算法张迎春整合测试分词算法整合测试分词算法黄漠源修复提取.....
分类:
其他好文 时间:
2014-11-12 19:36:26
阅读次数:
177
前言 各位朋友,谢谢大家的支持,由于文件过大,有考虑到版权的问题,故没有提供下载,本人已建立一个搜索技术交流群:77570783,源代码已上传至群共享,需要的朋友,请自行下载! 首先自问自答几个问题,以让各位看官了解写此文的目的什么是站内搜索?与一般搜索的区别?很多网站都有搜索功能,很多都是用S.....
分类:
Web程序 时间:
2014-11-12 19:27:35
阅读次数:
237
============问题描述============ 最近的安卓开发中需要用到中文分词,就用了中科院的这个分词系统,但是按java应用程序方法引入API中的文件(DATA,ICTCLAS,Configure)等程序总会报错,请问有人在安卓平台上用过吗?麻烦告诉我该如何引用,如果有别的分词系统使用...
分类:
移动开发 时间:
2014-11-11 16:10:08
阅读次数:
206
前面几篇关于solr的文章在导入数据进行分词、索引,都是通过导入本地的XML或者直接在页面上填写XML。但是现实中,很多情况下数据源是来自于数据库的。所以,本文就以mysql为例进行一个较详细的介绍。其使用到的是“dataimport”。1、在conf\solrconfig.xml中添加,增加导入数据..
分类:
数据库 时间:
2014-11-11 02:12:26
阅读次数:
270
solr 分词词库管理思路大概有以下几种思路:1。 自定义 SolrRequestHandler 由 SolrRequestHandler 来进行对分词器,进行A)词库加载B)动态添加词库 等操作 这样的话,还需要在内存中hold 住所有的词,或者需要引用到分词的jar2. 在自定义分词器中...
分类:
其他好文 时间:
2014-11-10 19:48:26
阅读次数:
170
【中文自动分词算法】 当在搜索引擎中搜索“软件使用技巧”时,搜索引擎通常会帮你找出同时含有”软件“、”使用“、”技巧“的网页。一个好的新闻网站通常会有“相关文件推荐”的功能,这也要依赖于自动分词的算法。要想让计算机准确切分并不容易,例如某网站报道北京大学生,而相关文章里列出的全是北京大学的新闻。这....
分类:
编程语言 时间:
2014-11-10 11:43:12
阅读次数:
218
第一部分1 初级句型-简单句(Simple Sentences):(1.1)基本句型&补语、(1.2)名词短语&冠词、(1.3)动词时态、(1.4)不定式短语、(1.5)动名词、(1.6)分词、(1.7)形容词、(1.8)副词、(1.9)语气词、(1.10)介词、(1.11)主谓一致性1.1 五种基...
分类:
其他好文 时间:
2014-11-10 11:24:54
阅读次数:
433