从豆瓣图书Top250抓取数据,并通过词云图展示 导入库 抓取数据 提取词云图要展示的数据 绘图设置 结果展示 参考来源: 微信公众号:数据不吹牛(shujubuchuiniu) https://blog.csdn.net/weixin_40864434/article/details/903015 ...
分类:
其他好文 时间:
2019-08-25 19:39:31
阅读次数:
194
豆瓣TOP250的大遗珠,仅7.9分,上映52年,值得所有年轻人一看 《毕业生》 ...
分类:
其他好文 时间:
2019-08-24 13:39:46
阅读次数:
119
基于requests模块发起ajax的get请求 需求:爬取豆瓣电影分类排行榜 https://movie.douban.com/中的电影详情数据 用抓包工具捉取 使用ajax加载页面的请求 鼠标往下下滚轮拖动页面,会加载更多的电影信息,这个局部刷新是当前页面发起的ajax请求, 用抓包工具捉取页面 ...
分类:
编程语言 时间:
2019-08-20 01:23:58
阅读次数:
133
更换PIP源 PIP源在国外,速度慢,可以更换为国内源,以下是国内一些常用的PIP源。 豆瓣(douban) http://pypi.douban.com/simple/ (推荐) 清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/ 阿里云 http://m ...
分类:
其他好文 时间:
2019-08-19 13:21:40
阅读次数:
325
拿到数据先对数据进行处理:删除空行、删除重复值 对相应数据进行查找替换:(尽量保证数据的客观性、真实性) 中国浙江--中国 中国*--中国 美国*--美国 日本*--日本等 1、豆瓣电影近十年上映数量分析: 可以看出2016、2017年电影数量较高,那么哪几个国家的电影产量比较高呢? 数据显示,近十 ...
分类:
其他好文 时间:
2019-08-19 12:52:54
阅读次数:
110
工作这几年,git的操作还是停留在廖老师的git教程的基础水平。考虑到今后要逐渐承担更重要的工作内容,决定重新深入学习Git。首先是学习资料的选择,买过的实体书是《Git版本控制管理》,但之前看了是云里雾里的。还有另外一本书籍是《精通Git》,是Pro Git的翻译,官网有开源书。今天看了下豆瓣的评 ...
分类:
其他好文 时间:
2019-08-16 00:53:18
阅读次数:
111
特点: 抓取: 豆瓣电影数据抓取案例 1.目标 2.F12抓包(XHR) 3.代码实现 import requests import time from fake_useragent import UserAgent class DoubanSpider(): def __init__(self): ...
分类:
Web程序 时间:
2019-08-14 17:11:02
阅读次数:
163
环境windows7python3.7.2安装进入官网:https://www.python.org/downloads(windows)选择:Windowsx86-64web-basedinstaller测试python-Vpip国内源V2EX:http://pypi.v2ex.com/simple豆瓣:http://pypi.douban.com/simple中国科学技术大学:http://p
分类:
编程语言 时间:
2019-08-13 13:49:44
阅读次数:
144
小说 追风筝的人 | 卡勒德·胡赛尼 豆瓣:8.9 (https://book.douban.com/subject/1770782/) 故事如此残忍而又美丽,作者以温暖细腻的笔法勾勒人性的本质与救赎,读来令人荡气回肠。 我的推荐理由: 麦田里的守望者 一个人生活 你别无选择 三体 | 刘慈欣 霍乱 ...
分类:
其他好文 时间:
2019-08-13 09:16:48
阅读次数:
98
太久没有写爬虫了,掌握的知识不能让他生疏了 想了想写一个按照输入,能查询到豆瓣里的信息 首先,先打开豆瓣的搜索页面 会发现是这样的,左边有一栏标签,然后有个搜索框。 可以点击标签,观察url的变化,发现https://www.douban.com/search?cat=1001&q=中的cat也相对 ...
分类:
其他好文 时间:
2019-08-11 18:52:49
阅读次数:
161