搜索关键字：soup，搜索到551个结果！码迷,mamicode.com！

bs4取数

# -*- coding: utf-8 -*-from bs4 import BeautifulSoupdef file2soup(ffile): with open(ffile,'r+b') as f: f.encoding='utf-8' soup=BeautifulSoup(f,'lxml') ...

分类：其他好文时间：2017-06-17 14:22:57 阅读次数：137

bs4

对象的种类 Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag , NavigableString , BeautifulSoup , Comment 。 Tag Tag对象与XML或者HTML原生文档中的tag相同 ...

分类：其他好文时间：2017-06-16 10:17:34 阅读次数：228

python 字符串匹配问题

想匹配html = 安装最新版python各种数据库的注释中的‘56845037’和‘59120585’，尝试用正则：pattern_l = r''''''re.findall(pattern_l,html)结果不成功。返回为空，有用： soup = BeautifulSoup(... ...

分类：编程语言时间：2017-06-11 14:54:29 阅读次数：131

Ubuntu下安装BeautifulSoup4

先去下载beautifulsoup的安装包https://www.crummy.com/software/BeautifulSoup/bs4/download/4.0/ 下载完之后解压然后进包里面，里面有一个setup.py文件，执行它然后就大功告成了，安装完之后我们就可以去爬虫了 ...

分类：系统相关时间：2017-06-11 12:06:17 阅读次数：176

python爬虫：BeautifulSoup 使用select方法详解

我们在写 CSS 时，标签名不加任何修饰，类名前加点，id名前加 #，在这里我们也可以利用类似的方法来筛选元素，用到的方法是 soup.select()，返回类型是 list（1）通过标签名查找（2）通过类名查找（3）通过 id 名查找（4）组合查找组合查找即和写 class 文件时，标签名 ...

分类：编程语言时间：2017-06-10 18:25:29 阅读次数：213

htmlunit

一款开源的java页面分析工具,可以解析js加载出来的页面数据 ...

分类：Web程序时间：2017-06-08 23:49:17 阅读次数：487

前端模块化发展简史

前端发展日新月异，短短不过 10 年已经从原始走向现代，甚至引领潮流。网站逐渐变成了互联网应用程序，代码量飞速增长，为了支撑这种需求和变化，同时兼顾代码质量、降低开发成本，接入模块化势在必行。伴随这一变化的是相对应的构建工具的快速成长，或是为了优化、或是为了转义，都离不开这类工具。所谓温故而知新， ...

分类：其他好文时间：2017-06-04 00:13:04 阅读次数：252

使用python抓取并分析数据—链家网(requests+BeautifulSoup)（转）

本篇文章是使用python抓取数据的第一篇，使用requests+BeautifulSoup的方法对页面进行抓取和数据提取。通过使用requests库对链家网二手房列表页进行抓取，通过BeautifulSoup对页面进行解析，并从中获取房源价格，面积，户型和关注度的数据。准备工作首先是开始抓取前 ...

分类：编程语言时间：2017-05-31 13:55:10 阅读次数：193

Python实例之抓取淘宝商品数据（json型数据）并保存为TXT

本实例实现了抓取淘宝网中以‘python’为关键字的搜索结果，经详细查看数据存储于html文档中的js脚本中，数据类型为JSON 通过浏览器相关工具发现捧腹网笑话页面的数据存储在HTML页面而非json数据中，因此可以直接使用soup.select()方法来抓取数据，具体实现代码如下： ...

分类：编程语言时间：2017-05-29 19:09:54 阅读次数：287

【爬虫】beautiful soup笔记（待填坑）

Beautiful Soup是一个第三方的网页解析的模块。其遵循的接口为Document Tree，将网页解析成为一个树形结构。其使用步骤如下： 1、创建对象：根据网页的文档字符串 2、搜索节点：名称、属性、文字。 3、处理节点： BeautifulSoup(文档字符串， 'html.parser ...

分类：其他好文时间：2017-05-27 15:28:18 阅读次数：218

共551条上一页 1 ... 42 43 44 45 46 ... 56 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)