搜索关键字：获取网页，搜索到745个结果！码迷,mamicode.com！

爬虫涉及的知识体系

一爬虫的定义：所谓爬虫就是指：可以获取网页信息的程序又分为通用爬虫和聚焦爬虫1)通用爬虫：从互联网中搜集网页，采集信息，这些网页信息用于为搜索引擎建立索引从而提供支持，它决定着整个引擎系统的内容是否丰富，信息是否即时，因此其性能的优劣直接影响着搜索引擎的效果。抓取流程：除了HTML文件外，搜索引擎通常还能抓取和索引以文字为基础的多种文件类型，如PDF、Word、WPS、XLS、PPT、TXT文件等

分类：其他好文时间：2018-10-02 17:28:56 阅读次数：219

如何直接获取网页上的数据到工作表

这个网页上的数据不能复制，如何获取网页中的数据到Excel工作表中呢？（常见问题）如何提取网页上的表格数据怎么利用excel获取网上数据如何实时获取网页上的数据信息【资料来源于网络搜索：王西猛讲师的网络课堂】【解决方法，wangqiang博客推荐视频教程】wangqiang博客推荐视频教程

分类：Web程序时间：2018-10-02 17:22:53 阅读次数：216

python (一）

1、查找网页utf编码importurllibifname==‘main‘:req=urllib.urlopen(‘自己想查看的网址‘）html=req.read()dehtml=html.decode(‘utf-8‘)printdehtml2、自动获取网页编码安装chardetpython-mpipinstallchardetimporturllibimportchardetif

分类：编程语言时间：2018-09-30 16:31:50 阅读次数：161

如何使用IE9浏览器自带开发人员工具捕获网页请求

我们在通过浏览器访问一个网页的时候，有时候会遇到页面不能正常显示，图片不能正常加载的问题。如果我们需要知道浏览器打开该网页时，网页中每个元素的加载情况。这时，我们便可以借助浏览器自带开发人员工具，来获取网页请求的信息。以下以IE9浏览器为例，接下来主要介绍如何使用浏览器自带开发人员工具捕获网页请求 ...

分类：Web程序时间：2018-09-30 14:41:56 阅读次数：343

python之屏幕抓取

Tidy 和 HTML 解析 Beautiful Soup 屏幕抓取：是通过程序下载网页并从中提取信息的过程。简单来见：下载数据并对其进行分析思路：可使用urllib来获取网页的HTML代码，再使用正则表达式从中提取信息。例如：假设要从python Job Board（http://pytho ...

分类：编程语言时间：2018-09-25 15:29:25 阅读次数：437

Xpath语法-爬虫(一)

前言这一章节主要讲解Xpath的基础语法，学习如何通过Xpath获取网页中我们想要的内容;为我们的后面学习Java网络爬虫基础准备工作。备注:此章节为基础核心章节，未来会在网络爬虫的数据解析环节经常使用，学会Xpath解析语法，可为未来爬虫解析省去很多麻烦。 Xpath简介 XPath即为XML ...

分类：其他好文时间：2018-09-24 20:03:27 阅读次数：244

ios开发之--给WebView加载进度条

不是新东西，就是在项目里面用到H5页面的时候，中间加载延迟的时候，在最上面加载一个进度条，代码如下：思路是：给WKWebView添加一个观察者，WKWebView有一个属性estimatedProgress，就是当前网页加载的进度，所以监听这个属性，然后再开始加载网页的时候显示progress，在 ...

分类：移动开发时间：2018-09-22 18:23:40 阅读次数：241

PHP获取路径

//获取域名或主机地址 //获取网页地址 //获取网址参数 //获取用户代理 //获取完整的url //包含端口号的完整url //只取路径应用案例，根据浏览器类型，自动切换 ...

分类：Web程序时间：2018-09-06 14:47:53 阅读次数：143

bs4常用用法

from bs4 import BeautifulSoupimport requests#获取爬去的网址url=requests.get('https://movie.douban.com/subject/24773958/')#获取网页源代码v_source=BeautifulSoup(url.t ...

分类：其他好文时间：2018-09-01 12:43:49 阅读次数：273

python爬虫 | 一条高效的学习路径

数据是创造和决策的原材料，高质量的数据都价值不菲。而利用爬虫，我们可以获取大量的价值数据，经分析可以发挥巨大的价值，比如：豆瓣、知乎：爬取优质答案，筛选出各话题下热门内容，探索用户的舆论导向。淘宝、京东：抓取商品、评论及销量数据，对各种商品及用户的消费场景进行分析。搜房、链家：抓取房产买卖及租 ...

分类：编程语言时间：2018-08-29 10:47:04 阅读次数：139

共745条上一页 1 ... 13 14 15 16 17 ... 75 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)