Python之路【第十九篇】:爬虫 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。 Requests Python标准库中提供了:urllib ...
分类:
编程语言 时间:
2016-11-06 22:54:54
阅读次数:
434
#coding=utf-8import requestsfrom lxml import etreeimport sysimport reimport csvsys.getdefaultencoding()reload(sys)sys.setdefaultencoding('utf-8')proxi ...
分类:
其他好文 时间:
2016-11-06 17:25:44
阅读次数:
199
反射型: 在表单输入jack网页源代码:<pre>Hello jack</pre> 测试: 低级别:<script>alert('xss')</script> 代码:直接对输入判断,没有任何安全过滤<?php // Is there any input?if( array_key_exists( " ...
分类:
其他好文 时间:
2016-11-06 02:54:44
阅读次数:
986
login.py#!/usr/bin/pythonufile=‘user.txt‘lockfile=‘lock.txt‘importtab,oslogincleck=Falseloginlock=Falselocknum=1whileTrue:print"InputIDandPassword.Please"userid=raw_input("UserID:").strip()userpass=raw_input("Password:").strip()iflen(userid)>0andlen(user..
分类:
编程语言 时间:
2016-11-04 02:40:23
阅读次数:
189
该程序的作用是用户输入数字后,会删掉列表中对应的元素,然后再把列表中剩余的元素写入文件中 ...
分类:
其他好文 时间:
2016-11-04 01:53:11
阅读次数:
147
首先是爬取了我们学校贴吧的贴吧数据,每个帖子都有是否是精品贴的标签。 根据帖子标题信息,实现了贴吧精品贴和普通贴的分类。错误率在10%左右。 切词用的是jieba吧,没有过滤点停用词和标点符号,因为标点符号其实也是可以算是区分帖子是否是精品贴的而一个重要特征;其实还可以增加几个特征,比如第一页是否含 ...
分类:
其他好文 时间:
2016-11-04 01:10:12
阅读次数:
299
Python strip()方法 描述: Python strip()方法用于移除字符串头尾指定的字符(默认为空格)。 语法: 参数: chars -- 移除字符串头尾指定的字符。 实例: 运行结果: Python split()方法 描述: Python split()通过指定分隔符对字符串进行切 ...
分类:
编程语言 时间:
2016-11-01 14:33:26
阅读次数:
166
sys
user_file=lock_file=f=(user_file,)
user_list=f.readlines()
:username=().strip()
lock_list=(lock_file,)
linelock_list.readlines():
line=line.split()
username==line[]:
sys.exit(%username)
lineuser_list:
line=line.split()
username==line[]:
limit():
passwor..
分类:
其他好文 时间:
2016-10-31 22:58:05
阅读次数:
321
#很简单,利用strip函数去除左右两边的空格,然后用split函数分割成列表 class Solution(object): def lengthOfLastWord(self, s): """ :type s: str :rtype: int """ if s==None:return 0 sl ...
分类:
编程语言 时间:
2016-10-31 20:51:08
阅读次数:
157
使用asmcmd cp命令 把datafile从文件系统移动(move)到asm磁盘组中--针对11gR2参考原文:How to Move a Datafile from Filesystem to ASM Using ASMCMD CP Command. (Doc ID 1610615.1)适用于 ...
分类:
移动开发 时间:
2016-10-31 16:13:32
阅读次数:
258