标签:字段 phi 搜索 www 排列 base 大数据 错误 函数
源码说明:
1、全自动采集,智能排列,千万级资源秒内响应;
2、采用coreseek+sphinx+php+mysql架构来实现站内搜索,百万数据的搜索速度基本都是控制在1秒以内,大数据+高并发;
3、演示站点:http://www.dhlgb.com
关于采集说明:
1、直接是采集的官方的接口;
2、可以多线程挂机采集;
3、平均每天采集可达30万数据,如刻意导入点分享资源的多的用户,每天采集数量可达100w;
4、全程自动挂机,无需值守,只需要保持服务器正常运行就行;
注意:
1、本程序可以承载上亿数据(亲测);
2、本程序因搜索框架的特殊性,只保证在linux上正常运行。如您需要搭建在win平台下,请自行更改相关配置;
3、本程序专门做了分词适配,可以将适配度更好的内容展现给用户;
4、因考虑到数据至少以百万计算,本程序是伪静态url;
5、本程序前台框架为bootstarp
6、新版本中加入了手机版,演示站点没有做移动跳转,移动演示站请将www替换为m即可;
7、数据库全程索引优化,占用资源极少;
8、如果你的服务器内存比较小,请不要将分词词库做的太大;
首页截图:
程序更新:
2017-2-12
- v2版本发布,增加移动站支持
2016-10-06
- 修改模板 header_h1.html
- 数据库网盘资源几个表增加字段special_id_array
- 新增表sjy_hotk_idd
- 修改special.php
- 修改article.php
- 修改模板 artitle.html
- tools目录里边增加include目录
- 修改tools/caiji_baiduhot.php
- 修改tools/loop_caiji_hotkey.php
2016-10-07
- 修正地图生成
- 修正api采集入库规则
- 修正采集规则
2016-10-12
- 修正文档模块
- 修正sql函数类
- 修正模板文档的标签错误
2016-10-14
- api/caiJiToDatabase.php 增加了标题规则 过滤垃圾标题*
- tools/caiji.php 增加了标题规则 过滤垃圾标题*
标签:字段 phi 搜索 www 排列 base 大数据 错误 函数
原文地址:http://www.cnblogs.com/linzenews/p/6445328.html