首页
Web开发
Windows程序
编程语言
数据库
移动开发
系统相关
微信
其他好文
会员
首页
>
其他好文
> 详细
大数据的两种处理方式
时间:
2015-04-25 09:25:32
阅读:
127
评论:
0
收藏:
0
[点我收藏+]
标签:
大数据
laxcus
hadoop
spark
处理方式
大数据的处理方式有两种:基于内存的流式处理和基于硬盘的存储处理。
流式处理就好象是在经过的数据面前建一道水闸。数据流过这里,经过闸门的时候,就进行筛选过滤,分析出有价值的内容,然后丢弃,以后也不再使用。
存储处理则是建一个储水池。数据先放进入储水池存起来,需要的时候,再进到储水池里,在里面筛选分析,找到那些有价值的内容。这个过程中,因为水还在储水池里,没放掉,所以可以供下次继续使用。
存储模式的数据处理是可以重复的,用完再用,反复使用。但是因为硬盘本身的机械特性问题,导致它处理速度慢,速率不高。不过现在也还是有一些针对硬盘的优化措施。
流式处理因为数据的处理过程在内存里进行,内存的处理性能是硬盘的数个量级,所以它的处理速率比存储模式高很多。但是也因为数据驻留在内存里,内存的特性是掉电即失的,只能一次性使用。所以流式处理通常是用完即弃,象卫生巾。
大数据产品里,Spark是流式处理,Laxcus、Hadoop是存储处理。
大数据的两种处理方式
标签:
大数据
laxcus
hadoop
spark
处理方式
原文地址:http://blog.csdn.net/laxcus/article/details/45267289
踩
(
0
)
赞
(
0
)
举报
评论
一句话评论(
0
)
登录后才能评论!
分享档案
更多>
2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)
周排行
更多
分布式事务
2021-07-29
OpenStack云平台命令行登录账户
2021-07-29
getLastRowNum()与getLastCellNum()/getPhysicalNumberOfRows()与getPhysicalNumberOfCells()
2021-07-29
【K8s概念】CSI 卷克隆
2021-07-29
vue3.0使用ant-design-vue进行按需加载原来这么简单
2021-07-29
stack栈
2021-07-29
抽奖动画 - 大转盘抽奖
2021-07-29
PPT写作技巧
2021-07-29
003-核心技术-IO模型-NIO-基于NIO群聊示例
2021-07-29
Bootstrap组件2
2021-07-29
友情链接
兰亭集智
国之画
百度统计
站长统计
阿里云
chrome插件
新版天听网
关于我们
-
联系我们
-
留言反馈
© 2014
mamicode.com
版权所有 联系我们:gaon5@hotmail.com
迷上了代码!