标签:http os sp for 文件 on 数据 问题 bs
---恢复内容开始---
最近接了一个私单,简单的学校网站,注意,我一看上去是感觉很快,仿站,对方说这个东西你三天就能搞定啦,我也这么想的
(没经验啊)
接下来,我想都没想就用dedecms去做,之前看了韩顺平的dedecms,都了解了多小,我最看中的是采集功能,因为对方说本来是用
asp做的,数据库是access的,这个我一听就很惊讶,因为学校的服务器是很老的那种,不支持Php,现在要改成php
ok,开始动工
dedecms上手其实不难,用好才难
1,建立每个栏目的采集节点
1.1 列表页的麻烦
一般的做法都是用字符串截取的比较多,例如先匹配好列表页的规则,收集好url地址,然后进一步的去采集文章
这里的问题就是分页,遇到目标站列表的分页没有规则是比较麻烦的,因为目标站是用aspx去做的,连分页请求都用Post去做,我fuck
所以没办法,只好手工写js代码去匹配,然后保存到一个文件
1.2 内容页规则
建立好url种子,就开始分析文章的格式
一般来说,我们都是要采集,标题,内容,图片,等等,这个麻烦点就是目标站的文章模板有的都不一致,导致自己要去写几个规则
刚好这个站也有图片集的内容,dedecms也支持这个,十分不错
1.3 开始采集
过程还算顺利,当中会遇到明明已经有内容,但dedecms报未下载,这个可能是网络问题吧
1.4 导入到栏目
这个我用得不是很爽,不能自由的选择一部分导入到某个栏目,一导就要导全部
2 换模板
2,1 设置模板目录
换套模板系统参数设置一下系统模板目录就可以了
2.2 设置每个栏目的文列表页模板,文章页模板,这个不难
2.3 设置每个文章的内容页,这个也不难
2.4 之前很笨,每次调式模板都要重新生成一次,后来才知道可以动态去浏览,去预览就可以啦
3 栏目单页
3.1 这个dede设计的不错,比如一些企业简介就可以用单页啦,联系方式就可以用单页啦
4 友情链接
4.1 这个就比较恶心啦,虽然dedecms可以每个循环显示,但不能按分类显示
5,分页
5.1 这个更恶心,不能自定义样式,所以要改源码
6 模板标签
6.1 这个其实不算灵活,应该不像smaty可以if else ,foreach,遇到一些特别的排版就不行啦,比如二级三级分类地显示文章
6.2 支持sql语句查询,这个还算可以的
6.3 自定义模板标签也是可以的,用户可以自己按照特别的需求去写标签
7 这个要吐槽一下,虽然官方说可以完全动态浏览,但是后台找不到一个地方可以设置,但总体来说,仿站还是很快的,像我这种新手遇到的坑比较多而已
最后附上地址 http://zhongyida.106.360sw.cn/
---恢复内容结束---
标签:http os sp for 文件 on 数据 问题 bs
原文地址:http://www.cnblogs.com/simonlu/p/4127331.html