http://www.cnblogs.com/bonelee/p/6667955.html shinx索引部分源码分析——过程:连接到CSphSource对应的sql数据源,通过fetch row取其中一行,然后解析出field,分词,获得wordhit,最后再加入到CSphSource的Hits里 ...
分类:
其他好文 时间:
2017-04-05 12:29:42
阅读次数:
253
MongoDB在大多数的情形中都是作为数据存储的模块而被使用,作为一个数据库,一般不应该承担更多的任务。 从专业性的角度来说,将文本搜索的任务交由专业的搜索引擎来负责,往往是更好的选择。 常用的搜索引擎与MongoDB往往都有着现成的工具,可以方便的进行结合。 1、Sphinx与mongodb-sp ...
分类:
数据库 时间:
2017-04-05 00:35:45
阅读次数:
303
看到前同事发布的“Markdown/reST 文档发布流水线”基于TFS、Docker、Azure等工具和平台进行文档发布的介绍说明,不得不在心中暗暗竖起大拇指。这套模式,实现了文档编写后版本管理、发布、存档、分享的高度自动化,它不仅仅可以应用在文章中介绍的技术文档发布模式,同样也适用于我们大多数w ...
分类:
编程语言 时间:
2017-04-04 20:43:11
阅读次数:
228
由于项目需要全文检索,后面就去网上查了下资料,找到了Sphinx【中文是狮身人面像】这个全文检索引擎,听说挺好用的,不过没有中文分词。后面又去找了一下,找到了Coreseek,一款中文全文检索/搜索软件。 一、Sphinx PHP扩展下载 PHP已经有专门的Sphinx的扩展文件,点击这里可以下载到 ...
sphinx介绍:http://www.sphinx-doc.org/en/stable/文档编辑流程:#pandoc-s"F:\svn\Doc\extmail.docx"-tmarkdown-oF:\svn\Doc\extmail.
md
#pandocF:\svn\Doc\extmail.md--frommarkdown--torst-s-oF:\svn\Doc
\extmail.rst
1、编辑build文件夹内容
2、修改build/index.rst内容..
分类:
其他好文 时间:
2017-03-10 19:38:01
阅读次数:
206
源码说明: 1、全自动采集,智能排列,千万级资源秒内响应; 2、采用coreseek+sphinx+php+mysql架构来实现站内搜索,百万数据的搜索速度基本都是控制在1秒以内,大数据+高并发; ...
分类:
移动开发 时间:
2017-02-26 19:37:11
阅读次数:
953
Coreseek就是Sphinx的中文版 官方网站 一、安装 1.修改LANG 2.安装依赖包 3.下载coreseek4.1并解压(如果网址不行请到官方网站http://www.coreseek.cn/搜索下载地址) 4.安装mmseg3 5.安装csft 6.安装libsphinxclient ...
分类:
其他好文 时间:
2017-02-05 16:47:43
阅读次数:
256
1.必须先关闭守护进程才能做其他的操作(第一次启动不需要这一步) 2.删掉原来的配置文件(第一次启动不需要这一步) 3.重新设置配置文件 文件内容根据具体需求配置,具体需求请查看官方网站 ...
分类:
其他好文 时间:
2017-02-05 16:46:59
阅读次数:
141
1、搜索引擎原理——从索引、搜索、facet底层原理看搜索引擎的本质2、开源搜索引擎分析——lucene(ES、Solr)、sphinx、wukong、bleve、poseidon、indextank-engine3、商业搜索引擎Splunk介绍——性能,架构,底层窥探4、提升CIS智能检索性能的方 ...
分类:
其他好文 时间:
2017-01-26 18:11:16
阅读次数:
436
代码重构 6大原则: 单一职责原则(一个类最好最好只有一种行为动机,太多承担职责会导致耦合度太高)、 开放封闭原则(功能可以扩展,但是不可以内部修改)、 依赖倒转原则(应该依赖抽象而不应该依赖具体对象)、 里氏代换原则(父类都替换成它的子类程序的行为没有变化。 正是有了里氏代换原则,才使得”开-闭“ ...
分类:
编程语言 时间:
2017-01-09 20:37:53
阅读次数:
331