码迷,mamicode.com
首页 > 编程语言 > 详细

python爬取昵称并保存为vss

时间:2019-12-06 21:25:12      阅读:102      评论:0      收藏:0      [点我收藏+]

标签:overflow   replace   name   ret   col   爬取   htm   png   strong   

代码:

 1 import sys
 2 import io
 3 import re
 4 sys.stdout=io.TextIOWrapper(sys.stdout.buffer,encoding=gb18030)
 5 import requests
 6 from bs4 import BeautifulSoup
 7 
 8 def html_save(s):
 9     with open(Name.csv,a)as f:
10         f.write(s+\n)
11 # soup = BeautifulSoup(html,‘index‘)
12 def getName_link():
13     lst=[]
14     soup = BeautifulSoup(open(Girl.html))
15     for div in soup.find_all(div,{class:babynology_textevidence babynology_bg_grey babynology_shadow babynology_radius left overflow_scroll}):
16         for strong in div.find_all(strong):
17             print(strong.find_all(a)[0].text.replace(    ,‘‘).replace( ,‘‘).replace(\n,‘‘))
18             # print(strong.find_all(‘a‘)[0].get(‘href‘).replace(‘\n‘,‘‘))
19             i=strong.find_all(a)[0].text.replace(    ,‘‘).replace( ,‘‘).replace(\n,‘‘)
20             # j=strong.find_all(‘a‘)[0].get(‘href‘).replace(‘\n‘,‘‘)
21             # lst.append(j)
22             html_save(i)
23             # html_save(j)
24     # print(lst)        
25     # return lst
26 getName_link()

运行结果:

技术图片

 

 

python爬取昵称并保存为vss

标签:overflow   replace   name   ret   col   爬取   htm   png   strong   

原文地址:https://www.cnblogs.com/huanghuangwei/p/11997503.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!