码迷,mamicode.com
首页 > 其他好文 > 详细

文件编码解读

时间:2017-05-08 21:51:21      阅读:137      评论:0      收藏:0      [点我收藏+]

标签:urlopen   decode   lang   text   blog   api   bytes   find   soup   

 1 lines (8 sloc)  333 Bytes
 2 from urllib.request import urlopen
 3 from bs4 import BeautifulSoup
 4 
 5 html = urlopen("http://en.wikipedia.org/wiki/Python_(programming_language)")
 6 bsObj = BeautifulSoup(html, "html.parser")
 7 content = bsObj.find("div", {"id":"mw-content-text"}).get_text()
 8 content = bytes(content, "UTF-8")
 9 content = content.decode("UTF-8")
10 print(content)

 

1 from urllib.request import urlopen
2 
3 textPage = urlopen("http://www.pythonscraping.com/pages/warandpeace/chapter1.txt")
4 print(str(textPage.read(),‘utf-8‘))用字符串转换编码

 

文件编码解读

标签:urlopen   decode   lang   text   blog   api   bytes   find   soup   

原文地址:http://www.cnblogs.com/caojunjie/p/6827793.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!