前两章简单的讲了Beautiful Soup的用法,在爬虫的过程中相信都遇到过一些反爬虫,如何跳过这些反爬虫呢?今天通过豆瓣网写一个简单的反爬中 什么是反爬虫 简单的说就是使用任何技术手段,阻止别人批量获取自己网站信息的一种方式。关键也在于批量。 反反爬虫机制 增加请求头 headers为了模拟更真 ...
分类:
其他好文 时间:
2019-07-05 19:26:08
阅读次数:
138
从事web开发工作有一小段时间,REST风格的接口,这样的词汇总是出现在耳边,然后又没有完全的理解,您是不是有和我相同的疑问呢?那我们一起来一探究竟吧! 就是用URL定位资源,用HTTP描述操作。 知乎大神Ivony有句话说的好: URL定位资源,用HTTP动词(GET,POST,DELETE,DE ...
分类:
其他好文 时间:
2019-07-05 14:22:06
阅读次数:
94
豆瓣推荐纪录片一、自然·科学·探索 我们的星球 岩合光昭的猫步走世界 冰冻星球 南太平洋 企鹅群里有特务 地球脉动 第三极 植物王国 极地 迁徙的鸟 航拍中国 美丽中国 旅行到宇宙边缘 恒星七纪 宇宙的奇迹 家园 蓝色星球 微观世界 宇宙时空之旅 生命循环:奇异的腐烂科学二、历史·人文·社会 乐士浮 ...
分类:
其他好文 时间:
2019-07-05 10:54:51
阅读次数:
123
https://dbaplus.cn/news-21-625-1.html 这样打破沙锅问到底的精神十分可贵!注意其中用到的工具 4月份的时候看到一道面试题,据说是腾讯校招面试官提的:在多线程和高并发环境下,如果有一个平均运行一百万次才出现一次的bug,你如何调试这个bug?(知乎原贴地址如下:ht ...
分类:
其他好文 时间:
2019-07-04 18:57:05
阅读次数:
132
背景:一直以来不清楚等额本息和等额本金的计算过程,也不明白孰优孰劣,这里做个记录汇总 知乎答案 https://www.zhihu.com/question/21745865 作者:金斧子链接:https://www.zhihu.com/question/21745865/answer/265450 ...
分类:
其他好文 时间:
2019-07-03 12:07:46
阅读次数:
130
推荐分享一个大神的人工智能教程。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到人工智能的队伍中来!http://www.captainbed.net/strongerhuang 我的网站:https://www.strongerhuang.com 我的知乎:https://www.zhihu ...
分类:
其他好文 时间:
2019-06-29 16:25:12
阅读次数:
154
内容整理自多个论坛博客。 主要参考:https://www.jianshu.com/p/b8cfa496b7ec https://www.jianshu.com/p/10b6074d772c https://www.douban.com/note/722996691/ 客户端渲染(CSR)VS服务端 ...
分类:
其他好文 时间:
2019-06-26 16:35:15
阅读次数:
125
关于本片随笔 笔者在阅读知乎老刘的文章后有感而写,本文按照自己的观点论述了分布式事务 侵删 本地事务 ACID特性 A Atomicity 原子性 C Consistency 一致性 I Isolation 隔离性 D Durability 持久性 一致性是最基本的特性,其他三个特性都是为了保持一致 ...
分类:
其他好文 时间:
2019-06-25 15:00:29
阅读次数:
115
一.爬虫的基本流程: 二.我们来爬一个校花网 并发版: 三.request的基本使用 1.get请求的两种方式: 每次url编码会很麻烦,所以可以在GET内添加参数即可: get请求访问知乎: get请求访问github: 2.post请求 3.response 下载一张图片: 补充: ...
分类:
编程语言 时间:
2019-06-24 00:56:37
阅读次数:
151
项目1:搜狗知乎,爬取指定存储上一级目录的名字,以及存储爬取的页码 项目2: ...
分类:
其他好文 时间:
2019-06-23 21:07:26
阅读次数:
89