码迷,mamicode.com
首页 > 编程语言 > 详细

python除去html标签

时间:2014-12-10 22:47:44      阅读:239      评论:0      收藏:0      [点我收藏+]

标签:python   html   标签   

使用python自带的HTMLParser 实现。

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import urllib2,re
import time,sys
from HTMLParser import HTMLParser
#设置默认编码
type = sys.getfilesystemencoding()

class MyHTMLParser(HTMLParser):
    def __init__(self):
        self.reset()
        self.fed = []
    def handle_data(self, d):
        self.fed.append(d)
    def get_data(self):
        return ''.join(self.fed)      

	
def main():
	parser = MyHTMLParser()
	parser.feed('<style type="text/css">#python { color: green }</style>')
	print parser.get_data().strip()
			
if __name__ == '__main__':
	main()
输出:

#python { color: green }

python除去html标签

标签:python   html   标签   

原文地址:http://blog.csdn.net/xyw_blog/article/details/41854941

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!