码迷,mamicode.com
首页 > 编程语言 > 详细

python应用案例

时间:2017-02-21 19:55:34      阅读:240      评论:0      收藏:0      [点我收藏+]

标签:generate   python   return   激活码   import   

  生成激活码

#!/usr/bin/env python
#encoding:utf-8
#Author:sean

import string
import random

#激活码中的字符和数字
field = string.letters + string.digits

#获得四个字母和数字的随机组合
def getRandom():
    return ‘‘.join(random.sample(field,4))
    
#生成的每个激活码中有几组
def concatenate(group):
    return ‘-‘.join([getRandom() for i in range(group)])
    
#生成n组激活码
def generate(n):
    return [concatenate(4) for i in range(n)]
    
if __name__ == ‘__main__‘:
    print generate(10)

  统计单词

#!/usr/bin/env python
#encoding:utf-8

import re
from collections import Counter
FileSource = ‘./media/abc.txt‘

def getMostCommonWord(articlefilesource):
    ‘‘‘输入一个英文的纯文本文件,统计其中的单词出现的个数‘‘‘
    pattern = r‘[A-Za-z]+|\$?\d+%?$‘
    with open(articlefilesource) as f:
        r = re.findall(pattern,f.read())
        return Counter(r).most_common()
        
if __name__ == ‘__main__‘:
    print getMostCommonWord(FileSource)

 提取网页正文

#!/usr/bin/env python
#encoding:utf-8

from goose import Goose
from goose.text import StopWordsChinese
import sys

#要分析的网页url
url = ‘

def extract(url):
    ‘‘‘
    提取网页正文
    ‘‘‘
    g = Goose({‘stopwords_class‘:StopWordsChinese}) 
    artlcle = g.extract(url=url)
    return artlcle.cleaned_text

if __name__ == ‘__main__‘:
    print extract(url)

本文出自 “忘情居” 博客,请务必保留此出处http://itchentao.blog.51cto.com/5168625/1899821

python应用案例

标签:generate   python   return   激活码   import   

原文地址:http://itchentao.blog.51cto.com/5168625/1899821

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!