码迷,mamicode.com
首页 > 其他好文 > 详细

组合数据类型练习,英文词频统计实例上

时间:2017-09-26 15:00:21      阅读:173      评论:0      收藏:0      [点我收藏+]

标签:mos   lis   images   pac   技术分享   es2017   对象   replace   初始化   

1.字典实例:建立学生学号成绩字典,做增删改查遍历操作。

#建立学生学号成绩字典
d={001:88,002:78,003:82,004:75,005:92,006:87,007:67,008:79}
#增加学生成绩
d[009]=94
#删除学生成绩
d.pop(008)
#修改学生成绩
d[007]=70
#查询学生成绩
d[005]
for i in d:
    print(i,d[i])

技术分享

 

2.列表,元组,字典,集合的遍历。
总结列表,元组,字典,集合的联系与区别。

s1=list(12345634512)
print(s1)
print(列表的遍历:)
for i in s1:
    print(i)
s2=tuple(12345634512)
print(s2)
print(元组的遍历:)
for i in s2:
    print(i)
d={a,b,c,d,e}
print(d)
print(字典的遍历:)
for i in d:
    print(i)
s3=set(12345634512)
print(s3)
print(集合的遍历:)
for i in s3:
    print(i)

技术分享

列表:列表list 是一种有序的序列,正向递增、反向递减序号。可以随时对元素进行增删改,元素的类型可以不同,没有长度的限制。

元组:元组tuple和列表非常相似,但元组一旦初始化就不能修改。

字典:dic使用键-值(key-value)存储,其中键必须是不可变的对象。

集合:set没有重复的值,是无序的。

 

3.英文词频统计实例

  1. 待分析字符串
  2. 分解提取单词
    1. 大小写 txt.lower()
    2. 分隔符‘.,:;?!-_’
    3. 单词列表
  3. 单词计数字典
news=‘‘‘WeChat, the most popular instant messaging application in China,
replaced its composite logon picture-which uses an image of Earth taken in 1972
by the crew of NASA‘s Apollo 17 spacecraft-on Monday.
It will use an image recently taken by the Fengyun 4A satellite until Thursday.‘‘‘
#将所有大写转换为小写
news=news.lower()
print(转换为小写的结果:+news+\n)
#将所有分隔符‘.,:;?!-_’替换为空格
for i in .,:;?!-_:
    news=news.replace(i, )
print(其他分隔符替换为空格的结果:+news+\n)
#分隔出一个一个单词
news=news.split( )
print(分隔结果为:,news,\n)
#单词计数字典
word=set(news)
dic={}
for i in word:
    dic[i]=news.count(i)

news=list(dic.items())
news.sort(key=lambda x:x[1],reverse=True)
print(单词计数字典结果为:,news,\n)

技术分享

 

组合数据类型练习,英文词频统计实例上

标签:mos   lis   images   pac   技术分享   es2017   对象   replace   初始化   

原文地址:http://www.cnblogs.com/suxihong/p/7595963.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!