不用SCRAPY也可以应用selector

时间：2020-02-06 14:29:01 阅读：62 评论：0 收藏：0 [点我收藏+]

标签：text gbk body 应用 tor ons title pass sts

在PY文件中：

from scrapy.selector import Selector
from scrapy.http import HtmlResponse

url="https://m.mm131.net/"
r=requests.get(url)
r.encoding=‘gbk‘  #根据情况可设置为utf-8
body=r.text
tx=Selector(text=body).xpath(‘//h2[@class="mm-title"]/text()‘).extract()
tx1=Selector(text=body).xpath(‘//article[@class="post"]/div‘).extract()
tx1=Selector(text=body).xpath(‘//article[@id="post-1"]/div‘).extract()
tx2=re.findall(‘src="(http.*?.jpg)"‘,str(tx1))
tx4=re.findall(‘data-img="(http.*?.jpg)"‘,str(tx1))
#tx2=re.findall(‘[^(gif)]‘,str(tx2))
tx3=re.findall(‘href="(.*?)"‘,str(tx1))
#print(tx4)
#print(tx2)
#print(tx3)
#print(tx1)
for aa in list(set(tx4)):
    adir=aa.split(‘/‘)[-2]
    name=aa.split(‘/‘)[-1]
    time.sleep(3)
    if os.path.exists(wz+adir+"/"):
        pass
    else:
        os.mkdir(wz+adir+"/")
    #break
    
    fname=wz+adir+"/"+adir+name
    print(fname)
    baocun(aa,fname)
    #break

不用SCRAPY也可以应用selector

标签：text gbk body 应用 tor ons title pass sts

原文地址：https://www.cnblogs.com/xkdn/p/12268259.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行