码迷,mamicode.com
首页 > 编程语言 > 详细

python 总结 常用处理函数

时间:2015-04-07 19:08:25      阅读:305      评论:0      收藏:0      [点我收藏+]

标签:


#
**整形转ascii!!!** def intToAscii(size): import binascii a16=hex(int(size)).lstrip("0x") for x in range(len(a16),4): a16=0+a16 return binascii.b2a_hex(a16) #**补零!!!** def addZone(size): a8=str(size) for x in range(len(str(size)),8): a8=str(0+a8) return a8
#**过滤HTML中的标签**
def filter_tags(htmlstr):
    import re
    #先过滤CDATA
    re_cdata=re.compile(//<!\[CDATA\[[^>]*//\]\]>,re.I) #匹配CDATA
    re_script=re.compile(<\s*script[^>]*>[^<]*<\s*/\s*script\s*>,re.I)#Script
    re_style=re.compile(<\s*style[^>]*>[^<]*<\s*/\s*style\s*>,re.I)#style
    re_br=re.compile(<br\s*?/?>)#处理换行
    re_h=re.compile(</?\w+[^>]*>)#HTML标签
    re_comment=re.compile(<!--[^>]*-->)#HTML注释
    s=re_cdata.sub(‘‘,htmlstr)#去掉CDATA
    s=re_script.sub(‘‘,s) #去掉SCRIPT
    s=re_style.sub(‘‘,s)#去掉style
    s=re_br.sub(‘‘,s)#将br转换为换行
    s=re_h.sub(‘‘,s) #去掉HTML 标签
    s=re_comment.sub(‘‘,s)#去掉HTML注释
    #去掉多余的空行
    blank_line=re.compile(\n+)
    s=blank_line.sub(\n,s)
    s=replaceCharEntity(s)#替换实体
    return s

#**替换HTML中的实体**
def replaceCharEntity(htmlstr):
    import re
    CHAR_ENTITIES={nbsp: ,160: ,
                lt:<,60:<,
                gt:>,62:>,
                amp:&,38:&,
                quot:",34:",}

    re_charEntity=re.compile(r&#?(?P<name>\w+);)
    sz=re_charEntity.search(htmlstr)
    while sz:
        entity=sz.group()#entity全称,如&gt;
        key=sz.group(name)#去除&;后entity,如&gt;为gt
        try:
            htmlstr=re_charEntity.sub(CHAR_ENTITIES[key],htmlstr,1)
            sz=re_charEntity.search(htmlstr)
        except KeyError:
            #以空串代替
            htmlstr=re_charEntity.sub(‘‘,htmlstr,1)
            sz=re_charEntity.search(htmlstr)
    return htmlstr
#**判断是否设置**
def isset(variable):
  if variable:
    return True
  return False


#时间戳转时间
def date(unixtime, format = %Y-%m-%d %H:%M):
  import datetime
  d = datetime.datetime.fromtimestamp(unixtime)
  return d.strftime(format)
#下载http图片 返回图片名称
def downImg(imgUrl):
  import urllib2
  import os
  import uuid
  url = imgUrl
  exten=url.split(.)
  name ="/var/www/html/downImg/"+str(date(time(), format = %Y%m%d))+/+str(uuid.uuid1())+"."+exten[3]
  fileD="/var/www/html/downImg/"+str(date(time(), format = %Y%m%d))+/
  if not os.path.exists(fileD):  #判断文件夹是否存在
        os.makedirs(fileD)
  #保存文件时候注意类型要匹配,如要保存的图片为jpg,则打开的文件的名称必须是jpg格式,否则会产生无效图片
  conn = urllib2.urlopen(url)
  f = open(name,wb)
  f.write(conn.read())
  f.close()
  return name

#微秒时间
def microtime() :
  import time
  import math
  return %f %d % math.modf(time.time())

 

python 总结 常用处理函数

标签:

原文地址:http://www.cnblogs.com/xxlogin/p/4398882.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!