码迷,mamicode.com
首页 > 其他好文 > 详细

计算人口平均年龄

时间:2018-08-14 14:49:52      阅读:192      评论:0      收藏:0      [点我收藏+]

标签:usr   pen   ISE   函数   from   tput   normal   imp   image   

创建实验数据:
from pyspark import SparkContext
import random
OutputFile = "file:///usr/local/spark/mycode/exercise/people"
sc = SparkContext(‘local‘,‘createPeopleAgeData‘)
peopleAge = []
for i in range(1,1001):
rand = random.randint(1,100)
peopleAge.append(str(i)+" "+str(rand))
RDD = sc.parallelize(peopleAge)
RDD.saveAsTextFile(OutputFile)
技术分享图片

 


from pyspark import SparkContext
#配置sc
sc = SparkContext(‘local‘,‘CountAverAge‘)
#创建RDD 读入数据
RDD = sc.textFile("file:///usr/local/spark/mycode/exercise/peopleAge.txt")
#得到数据总条数
Count =RDD.count()
#对数据进行切割,只取年龄部分,然后把年龄字符串转成Int,然后用reduce函数累加
Average = RDD.map(lambda line : line.split(" ")[1]).map(lambda a: int(a)).reduce(lambda a,b :(a+b))
 
print(Count)
print(Average)
print("平均年龄为:{0}".format(Average / Count))
技术分享图片

 

计算人口平均年龄

标签:usr   pen   ISE   函数   from   tput   normal   imp   image   

原文地址:https://www.cnblogs.com/SoftwareBuilding/p/9473533.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!