这段时间肯定经常听到一句话“我命由我不由天”,没错,就是我们国产动漫 哪咤,今天我们通过python还有上次写的pyquery库来爬取豆瓣网评论内容 爬取豆瓣网评论 1、找到我们想要爬取的电影 小哪咤 2、查看影片评论 点击查看我们的影评,发现只能查看前200个影评,这里就需要登录了 分析出来全部影 ...
分类:
其他好文 时间:
2019-08-11 15:13:13
阅读次数:
93
目录 前言 分析 具体步骤 登录 爬取与存储 可视化分析 结语 目录 前言 分析 具体步骤 登录 爬取与存储 可视化分析 结语 目录 前言 分析 具体步骤 登录 爬取与存储 可视化分析 结语 登录 爬取与存储 可视化分析 前言 前言 暑期档电影惨淡,但随着哪吒爆红开拓了新局面。这也是国产动画的首次爆 ...
分类:
其他好文 时间:
2019-08-08 13:03:13
阅读次数:
99
目前Python主要的应用领域: 云计算:云计算最火的语言,典型应用OpenStack web开发:众多优秀的web框架,众多大型网站均为Python开发,YouTube,豆瓣,典型框架有Django 科学运算,人工智能:典型库:scipy 系统运维:运维人员必备语言 金融:量化交易,金融分析 图形 ...
分类:
编程语言 时间:
2019-08-03 14:42:14
阅读次数:
84
前段时间写过一个通过cookies完成登录,今天我们写一篇通过post发送请求完成登录豆瓣网 模拟登录 1、首先找到豆瓣网的登录接口 打开豆瓣网站的登录接口,请求错误的账号密码,通过F12或者抓包工具找到登录接口 通过F12抓包获取到请求登录接口 2、分析登录接口参数数据 上面已经抓取到了登录的接口 ...
分类:
其他好文 时间:
2019-08-02 22:32:05
阅读次数:
148
1、将从豆瓣网页爬虫采集到的数据,连接mongo数据库,将数据导入至mongo中,代码如下: # 访问网址 # 使用requests 去访问 import pandas as pd import requests import pymongo import re u = 'https://book. ...
分类:
其他好文 时间:
2019-07-31 18:32:39
阅读次数:
502
修改python的镜像源 使用pip可以提高网速 \Lib\site packages\pip\models\index.py文件,将PYPI的值改为你所需要的镜像源即可,例如改为豆瓣镜像源: ...
分类:
编程语言 时间:
2019-07-27 09:32:10
阅读次数:
89
Python在安装库的时候发现下载速度很慢,可以更换为国内源国内比较好的源:清华源:https://pypi.tuna.tsinghua.edu.cn/simple豆瓣源:http://pypi.douban.com/simple/阿里源:http://mirrors.aliyun.com/pypi ...
分类:
编程语言 时间:
2019-07-26 14:28:08
阅读次数:
156
#从豆瓣安装 pip install kanren -i http://pypi.douban.com/simple --trusted-host pypi.douban.com 聚类算法 k-Means算法 第1步 - 需要指定所需的K个子组的数量。 第2步 - 修复群集数量并将每个数据点随机分配... ...
分类:
其他好文 时间:
2019-07-23 09:34:50
阅读次数:
100
上一篇我们讲过Cookie相关的知识,了解到Cookie是为了交互式web而诞生的,它主要用于以下三个方面: 会话状态管理(如用户登录状态、购物车、游戏分数或其它需要记录的信息) 个性化设置(如用户自定义设置、主题等) 浏览器行为跟踪(如跟踪分析用户行为等) 我们今天就用requests库来登录豆瓣 ...
分类:
编程语言 时间:
2019-07-22 09:36:44
阅读次数:
130