1.进入操作目录,创建脚本文件 2.编辑脚本文件 3.点击I进入编辑模式,添加执行提示 4.点击Esc退出编辑模式,输入:wq保存退出 5.执行脚本 6.编写第一个功能,实现在某个目录下创建多个文件 执行结果: 7.爬取百度首页信息 8.把爬取的数据保存到之前创建的数据文件中 结果: 9.向文件中添 ...
分类:
系统相关 时间:
2018-09-13 18:36:01
阅读次数:
216
本章由网络爬虫的编写来学习python。首先写几行代码抓取百度首页,提提精神,代码如下: 除了第一行导入第三方包之外,我们用5行代码实现了一个简单的程序:读取百度首页并存储在本地制定文件。下面来详细介绍代码: 1.import urllib.request urllib库是python的一个操作ur ...
分类:
编程语言 时间:
2018-09-07 13:58:26
阅读次数:
177
高级选择器分为:后代选择器、子代选择器、并集选择器、交集选择器 后代选择器 使用空格表示后代选择器。顾名思义,父元素的后代(包括儿子,孙子,重孙子) 子代选择器 使用>表示子代选择器。比如div>p,仅仅表示的是当前div元素选中的子代(不包含孙子....)元素p。 并集选择器 多个选择器之间使用逗 ...
分类:
其他好文 时间:
2018-08-14 22:55:20
阅读次数:
185
1 为什么要重点学习requests模块,而不是urllib requests的底层实现就是urllib requests在python2 和python3中通用,方法完全一样 requests简单易用 Requests能够自动帮助我们解压(gzip压缩的等)响应内容 2 requests的作用 ...
分类:
其他好文 时间:
2018-08-12 21:44:24
阅读次数:
234
默认情况下使用 这样获取到的是项目classpath 下的 aaa.txt 如果想获取非项目路径下的文件内容怎么办呢,看了下@Value的好像也没有说, 其实 这样是可以获取到 百度首页的内容的.它这里使用的是https协议. 那么同样的我们可以使用file协议获取文本的内容 即: 使用@Value ...
分类:
编程语言 时间:
2018-08-05 22:31:52
阅读次数:
340
1.练习目的 练习使用html,scc,js 完成界面样式,用ul标签实现文本框下拉,通过js完成添加列表内容等功能 2.效果 3.程序代码 4.总结 通过短期的学习,对html、css、js有了一些了解,但是发现要把众多的元素组合起来实现效果比想象的还要复杂,需要学习和积累。 ...
分类:
Web程序 时间:
2018-07-31 01:31:10
阅读次数:
297
http://www.testclass.net/ 测试教程网,专业的selenium 学习网站。 本节知识点: 操作对象: · click 点击对象 · send_keys 在对象上模拟按键输入 · clear 清除对象的内容,如果可以的话 WebElement 另一些常用方法: · text 获 ...
分类:
编程语言 时间:
2018-07-24 11:52:51
阅读次数:
202
以“百度”首页为模板,设计百度仿真页面,效果如: 代码: ...
分类:
Web程序 时间:
2018-07-23 14:47:30
阅读次数:
663
# coding=utf-8import timefrom selenium import webdriverbrowser = webdriver.Firefox()#启动火狐浏览器browser.get("http://www.baidu.com")#打开百度首页time.sleep(2)#停顿 ...
分类:
编程语言 时间:
2018-07-13 00:00:33
阅读次数:
238
一、input标签 1.input标签是对短文本的操作。如百度首页的输入框<input type="text" class="s_ipt" name="wd" id="kw" maxlength="100" autocomplete="off">。值存在于value中。进入控制界面输入命令 2.给v ...
分类:
其他好文 时间:
2018-07-12 22:49:00
阅读次数:
452