小月月是个懒家伙,博客更新好慢...前几天拿到某公司的面试题,要求在Linux/Ubuntu/Debian/Suse/Centos下用python2.7开发一个爬虫,抓取百度新闻搜索结果的前三页标题+url。这可把对python一窍不通的小月月难住了,肿么办呢...哦,最简单有效直接的方法就是网上查...
分类:
编程语言 时间:
2014-05-07 17:11:38
阅读次数:
457
最新版XDCMS企业管理系统,由于过滤不严,可绕过限制,导致多处SQL注入注入在XDCMS企业管理系统的注册功能处,来看看\system\modules\member\index.php文件:注册时会调用register_save,问题就出在index.php的register_save函数处:pu...
分类:
其他好文 时间:
2014-05-07 13:47:41
阅读次数:
346
内联接要应用两个逻辑查询处理步骤:它首先像交叉联接一样,对两个输入表进行笛卡尔积运算;然后根据用户指定的谓词对结果行进行过滤。和交叉联接一样,内联接也有两种标准语法:ANSI
SQL-92:需在两个表名之间指定 INNER JOIN 关键字。INNER 关键字是可选的,因为内联接是默认的联接方式,所...
分类:
其他好文 时间:
2014-05-07 13:29:59
阅读次数:
273
众所周知,jsonp可以解决跨域问题,下面是我在查阅资料和实际项目使用后的一些总结。Jquery中jsonp的使用//myUrl
= "http://localhost:8090/api/test";$.ajax({ type:"GET", url:myUrl,
dataType:"jsonp...
分类:
Web程序 时间:
2014-05-07 11:10:16
阅读次数:
362
1. 科普
通用搜索引擎处理的对象是互联网的网页,目前网页的数量数以亿计,所以搜索引擎面临的第一个问题是如何设计出高效的下载系统,已将海量的网页下载到本地,在本地形成互联网网页的镜像。网络爬虫就是担当此大任的。
抓取网页的过程其实和读者平时使用IE浏览器浏览网页的道理是一样的。比如说你在浏...
分类:
编程语言 时间:
2014-05-07 02:41:56
阅读次数:
368
基本命令ls :"列出"文件的基本命令. 但是往往就是因为这个命令太简单,
所以我们总是低估它. 比如, 使用-R选项, 递归选项, ls将会以目录树的形式列出所有文件. 另一个很有用的选项-S, 将会按照文件尺寸列出所有文件, -t,
将会按照修改时间来列出文件, -i选项会显示文件的inode。...
分类:
其他好文 时间:
2014-05-07 02:14:19
阅读次数:
394
以往,对于常见的SQL注入等漏洞,采取的方式一般都是对数据进行过滤,而对$_GET/$_POST/$_COOKIE/$_SERVER等全局数组变量的直接使用是不够安全的,故PHP
5.2.0版本以后,推出Filter系列函数,对外部脚本的数据进行过滤,比如POST表单中的email邮箱进行验证,则将...
分类:
Web程序 时间:
2014-05-07 02:07:31
阅读次数:
450
在用javascript对URL字符串进行编码
中,虽然escape()、encodeURI()、encodeURIComponent()三种方法都能对一些影响URL完整性的特殊字符进行过滤。
但后两者是将字符串转换为UTF-8的方式来传输,解决了页面编码不一至导致的乱码问题。例如:发送页与接受页的...
分类:
其他好文 时间:
2014-05-07 02:05:22
阅读次数:
614
1.首先下载JDK通过命令wget可以直接从linux下载 命令wget
URL地址2解压hadoop1.1.2.tar.gz3在grid用户目录下创建免密码通过ls
-a显示隐藏目录.ssh4实现免密码,只需要将公钥复制到另一台机的,并且另取名为authorized_keys
分类:
其他好文 时间:
2014-05-07 01:54:57
阅读次数:
258
本文以实际应用为目的,不在理论方面深究1、打开跟踪器或2、新建跟踪-事件选择-列筛选器,HostName默认不显示,需勾选“显示所有列”,如果希望只跟踪某一客户端,可按下面的设置HostName,其它过滤同理3、查看或搜索数据库执行语句,主要执行语句在TextData中
分类:
数据库 时间:
2014-05-06 23:50:16
阅读次数:
593