Hadoop 是 Apache 下一个开源的分布式的软件计算框架,它是由Doug Cutting根据 Google提出的分布式文件系统 GFS 和 MapReduce 编程模型而实现的。Hadoop 由许多部分组成,其核心是用于数据存储的分布式文件系统HDFS与用于分布式计算的 MapReduce....
分类:
其他好文 时间:
2016-01-26 21:48:01
阅读次数:
303
2.1 用户行为数据简介 显性反馈行为:用户明确表示对物品喜好的行为。评分、喜欢、不喜欢。 隐性反馈行为:不能明确反应用户喜好的行为。比如页面浏览。显性反馈数据隐性反馈数据用户兴趣明确 不明确数量较少庞大存储数据库分布式文件系统实时读取实时有延迟正负反馈都有只有正反馈 正反馈:用户的行为倾向于...
分类:
其他好文 时间:
2016-01-26 20:24:52
阅读次数:
190
HDFS是Hadoop Distribute File System 的简称,也就是Hadoop的一个分布式文件系统。
分类:
其他好文 时间:
2016-01-26 18:16:54
阅读次数:
238
本地文件系统如ext3,reiserfs等(这里不讨论基于内存的文件系统),它们管理本地的磁盘存储资源、提供文件到存储位置的映射,并抽象出一套文件访问接口供用户使用。但随着互联网企业的高速发展,这些企业对数据存储的要求越来越高,而且模式各异,如淘宝主站的大量商品图片,其特点是文件较小,但数量巨大;而...
分类:
其他好文 时间:
2016-01-23 21:34:48
阅读次数:
175
一、FastDFS简介FastDFS是一款开源的、分布式文件系统(Distributed File System),由淘宝开发平台部资深架构师余庆开发。作为一个分布式文件系统,它对文件进行管理,功能包括:文件存储、文件同步、文件访问(文件上传、文件下载)等,解决了大容量存储和负载均衡的问题,特别适合中小文件(建议范围:4KB < file_size <500MB),对以文件为载体的在线服务,如相册网...
分类:
其他好文 时间:
2016-01-22 11:01:14
阅读次数:
165
HDFS(Hadoop Distributed File System )Hadoop分布式文件系统。是依据google发表的论文翻版的。论文为GFS(Google File System)Google 文件系统(中文。英文)。HDFS有非常多特点:①保存多个副本,且提供容错机制,副本丢失或宕机自己...
分类:
其他好文 时间:
2016-01-16 19:24:59
阅读次数:
201
基础:linux常用命令、Java编程基础大数据:科学数据、金融数据、物联网数据、交通数据、社交网络数据、零售数据等等。Hadoop: 一个开源的分布式存储、分布式计算平台.(基于Apache)Hadoop的组成: HDFS:分布式文件系统,存储海量的数据。 MapReduce:并行处理框架...
分类:
其他好文 时间:
2016-01-15 12:55:14
阅读次数:
141
Hadoop7天课程 课程体系 Day01>>>>>>>>>>>>>>>>>>>> hadoop项目简介 hadoop简介 hadoop前景 apache的开源项目 解决问题:(核心) 海量数据的存储(HDFS) ---Hadoop分布式文件系统,解决机器怎么存储 海量数据的分析(MapReduce...
分类:
其他好文 时间:
2016-01-13 15:52:16
阅读次数:
258
文件系统选型NFSMFS(分布式文件系统)GFS(云计算存大文件)ext234xfs(c7rh7默认)选型:c5:ext3c6:ext4视频下载、流媒体、数据库、小文件以下需要单独安装:xfs数据库mysql等reiserfs大量小文件0,中小型网站1,重视维护方便2,大并发优化,缓存解决磁盘压力:cdn网站缓存..
分类:
其他好文 时间:
2016-01-11 06:58:01
阅读次数:
200
转自:http://www.cnblogs.com/liuling/p/2013-6-17-01.html相关源代码:http://www.cnblogs.com/ggjucheng/archive/2013/02/19/2917020.htmlHDFS是一个分布式文件系统,既然是文件系统,就可以对...
分类:
编程语言 时间:
2016-01-06 00:03:53
阅读次数:
192