IP相关统计 统计IP访问量(独立ip访问数量) 查看某一时间段的IP访问量(4-5点) 查看访问最频繁的前100个IP 查看访问100次以上的IP 查询某个IP的详细访问情况,按访问频率排序 页面访问统计 查看访问最频的页面(TOP100) 查看访问最频的页面([排除php页面】(TOP100) ...
分类:
其他好文 时间:
2019-03-21 14:24:45
阅读次数:
160
利用requests库和正则表达式 抓取猫眼电影TOP100 (requests比urllib使用更方便,由于没有学习HTML系统解析库 选用re) 1.目标 抓取电影名称 时间 评分 图片等 url http://maoyan.com/board/4 结果以文件形式保存 2.分析 offset 代 ...
分类:
编程语言 时间:
2019-01-17 12:06:10
阅读次数:
223
import requests from bs4 import BeautifulSoup url_list = [] all_name = [] all_num = [] all_actor = [] all_score = [] class Product_url(): # 这个地方传入的url... ...
分类:
编程语言 时间:
2018-12-31 17:23:19
阅读次数:
218
根据2018年1月15日CoinMarketCap的加密货币市值排名编写,这里介绍TOP10,具体请参考《区块链中文词典》维京&甲子 01.比特币/Bitcoin/BTC 一种点对点的去中心化加密货币 02.以太坊/Ethereum/以太币/Ether/ETH 下一代智能合约和去中心化应用平台 03 ...
分类:
其他好文 时间:
2018-12-30 22:06:42
阅读次数:
204
摘要: 作为小白,爬虫可以说是入门python最快和最容易获得成就感的途径。因为初级爬虫的套路相对固定,常见的方法只有几种,比较好上手。选取网页结构较为简单的猫眼top100电影为案例进行练习。 重点是用上述所说的4种方法提取出关键内容。一个问题采用不同的解决方法有助于拓展思维,通过不断练习就能够灵 ...
分类:
编程语言 时间:
2018-12-29 21:00:23
阅读次数:
237
12月26日,张江科投与鲸准联合发布了“洞见张江”创投数据库及2018张江创业创投TOP100企业排行榜单,包括张江人工智能数字产业TOP100企业、生命科学产业TOP100企业、张江独角兽及准独角兽企业榜单。 “洞见张江”是由张江集团旗下张江科投与鲸准联合推出的创投数据库,该数据库收录企业达510 ...
分类:
数据库 时间:
2018-12-27 22:55:34
阅读次数:
160
需要着重学习的地方:(1)爬取分页数据时,url链接的构建(2)保存json格式数据到文件,中文显示问题(3)线程池的使用(4)正则表达式的写法 import requests from requests.exceptions import RequestException import re im... ...
分类:
其他好文 时间:
2018-12-27 18:28:26
阅读次数:
171
大快搜索自荣获“2018中国大数据企业50强”殊荣,12月20日在由工信部指导,中国电子信息产业化发展研究院主办的2018中国软件大会上,大快搜索获评“2018中国大数据基础软件领域领军企业”称号,入选中国数字化转型TOP100服务商,《城市数据运河》获评优秀政务大数据解决方案。图:工业和信息化部信息化和软件服务业司司长在会上致辞图:大快搜索获评“2018中国大数据基础软件领域领军企业”在本届20
分类:
其他好文 时间:
2018-12-24 11:17:46
阅读次数:
143
在12月20日由中国电子信息产业发展研究院主办的2018中国软件大会上,大快搜索获评“2018中国大数据基础软件领域领军企业”,并成功入选中国数字化转型TOP100服务商。图:大快搜索获评“2018中国大数据基础软件领域领军企业”在本届2018中国软件大会上,不仅宣传并成立了数字转型促进会,还发布了由中国大数据产业生态联盟副秘书长、《软件和集成电路》杂志社总编辑郭嘉凯编辑的新书——《数据之翼-引领
分类:
编程语言 时间:
2018-12-24 11:16:09
阅读次数:
188
代码如下: 运行结果如下: 在top100.csv文件中的数据如下: 因为没有下载模块所以这里只是显示首页图片的链接,如果想下载首页图片还需再加上下载模块 ...
分类:
编程语言 时间:
2018-12-11 13:06:43
阅读次数:
202