码迷,mamicode.com
首页 >  
搜索关键字:requests 、beautifulsoup    ( 5272个结果
BeautifulSoup下Unicode乱码解决
今天在用scrapy爬某个网站的数据,其中DOM解析我用的是BeautifulSoup,速度上没有XPath来得快,不过因为用了习惯了,所以一直用的bs,版本是bs4不过在爬取过程中遇到了一些问题,其中一个是Unicode转码问题,这也算是python中一个著名问题了。我遇到的算是Beautiful...
分类:其他好文   时间:2014-07-22 22:53:55    阅读次数:229
(转)压力测试的轻量级具体做法
一:压力测试中需要掌握的几个基本概念1:吞吐率(Requests per second)服务器并发处理能力的量化描述,单位是reqs/s,指的是某个并发用户数下单位时间内处理的请求数。某个并发用户数下单位时间内能处理的最大请求数,称之为最大吞吐率。记住:吞吐率是基于并发用户数的。这句话代表了两个含义...
分类:其他好文   时间:2014-07-22 00:37:34    阅读次数:215
(转)python下很帅气的爬虫包 - Beautiful Soup 示例
官方文档地址:http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.htmlBeautiful Soup 相比其他的html解析有个非常重要的优势。html会被拆解为对象处理。全篇转化为字典和数组。相比正则解析的爬虫,省略了学习正...
分类:编程语言   时间:2014-07-18 11:35:42    阅读次数:287
Python 爬虫—— requests BeautifulSoup
本文记录下用来爬虫主要使用的两个库。第一个是requests,用这个库能很方便的下载网页,不用标准库里面各种urllib;第二个BeautifulSoup用来解析网页,不然自己用正则的话很烦。requests使用,1直接使用库内提供的get、post等函数,在比简单的情况下使用,2利用session...
分类:编程语言   时间:2014-07-11 18:51:34    阅读次数:250
轻量级的压力测试--转载
一:压力测试中需要掌握的几个基本概念1:吞吐率(Requests per second)服务器并发处理能力的量化描述,单位是reqs/s,指的是某个并发用户数下单位时间内处理的请求数。某个并发用户数下单位时间内能处理的最大请求数,称之为最大吞吐率。记住:吞吐率是基于并发用户数的。这句话代表了两个含义...
分类:其他好文   时间:2014-07-11 09:08:07    阅读次数:270
用python的BeautifulSoup分析html
http://www.cnblogs.com/twinsclover/archive/2012/04/26/2471704.html用python的BeautifulSoup分析htmlhttp://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.htmlBeautifulSoup中文文档1)搜索tag:find(tagname)#直接搜索名为tagname的tag如:find(‘head‘)find..
分类:编程语言   时间:2014-07-10 19:12:38    阅读次数:265
TI_DSP_SRIO - Doorbell原理(中断路由到core-1)
Doorbell的中断到core的机制是由DOORBELLx_ICRRx寄存器实现的,共有八个ICRR寄存器。 When doorbell packets are received by the SRIO peripheral, these ICRRs route doorbell interrupt requests(在ISCR寄存器中指示) from the associated doo...
分类:其他好文   时间:2014-07-08 16:36:13    阅读次数:419
学习笔记大型《构建高性能web站点》
吞吐率ab -n1000 -c 100 http://new.dangdang.com/测试结果重点关注:1个Requests per second,2个Time per request影响吞吐率的因素:并发策略、I/O模型、I/O性能、CPU核数、程序本身逻辑复杂度1、CPU并发计算系统负载:ca...
分类:Web程序   时间:2014-07-02 22:56:26    阅读次数:208
Android 官方文档:(二)应用清单 —— 2.26 <uses-permission>标签
syntax:contained in:description:Requests a permission that the application must be granted inorder for it to operate correctly. Permissions are grant....
分类:移动开发   时间:2014-07-02 09:59:26    阅读次数:203
MariaDB 10之并行复制--延迟测试结果
测试参数:sysbench--test=/root/sysbench0.5/sysbench/tests/db/insert.lua --mysql-table-engine=innodb--oltp-table-size=1000000 --max-requests=0--max-time=300--num-threads=16 --oltp-tables-count=10--report-interval=10 --mysql-host=10.8.8.100--mysql-port=3312--..
分类:数据库   时间:2014-07-02 06:44:36    阅读次数:280
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!