码迷,mamicode.com
首页 > 其他好文 > 详细

记录一下SparkStreaming中因为使用redis做数据验证而导致数据结果不对的问题

时间:2015-07-24 20:11:25      阅读:190      评论:0      收藏:0      [点我收藏+]

标签:

先说业务,

在flatMap阶段,当前指标会在redis去验证数据是否是新用户,如果是新用户,那么进行统计,统计会将该新用户add至我们的redis容器中。。。

这个业务其实很简单。。。但坑自己的是,flatMap后的RDD,会被两个不同的action使用。。。

然后。。。我发现第二个action中永远是统计不到新用户了。。。。。

不知道大家看出来问题的原因了吗?  我TMD排查一天才找到原因。

因为flatMap是个transform,每次action才会执行。 而我执行两次action那么flatMap就会执行两次, 结果就是第二次执行时,肯定一个新用户就没有了啊。。。

好坑

好坑

坑TMD死我了。。。。

记录一下SparkStreaming中因为使用redis做数据验证而导致数据结果不对的问题

标签:

原文地址:http://www.cnblogs.com/hark0623/p/4674089.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!