码迷,mamicode.com
首页 >  
搜索关键字:hadoop学习笔记    ( 191个结果
Hadoop学习笔记三:分布式hadoop部署
前语:如果看官是个比较喜欢使用现成软件的,比较推荐使用quickhadoop,这个使用参照官方文档即可,是比较傻瓜式的,这里不做介绍。本文主要是针对自己部署分布式hadoop。 1.修改机器名[root@localhost root]# vi /etc/sysconfig/network将HO...
分类:其他好文   时间:2015-01-20 22:00:48    阅读次数:448
Hadoop学习笔记一:准备工作之虚拟机安装Linux系统
由于笔者用于学习之目的,手头也没多余的机器,所以将Linux系统安装在VMware Workstation虚拟机上,VM建议使用6.0版本的,安装使用以及教程,网上资料比较齐全,安装虚拟机的过程,此处不再做讲述。VM安装Linux可以参照VMware虚拟机中安装Linux,以太网采用桥接模式。将.....
分类:系统相关   时间:2015-01-08 19:57:58    阅读次数:226
hadoop学习笔记
map函数执行结束后,map输出的<k, v>一共有4个,分别是<hello, 1><you, 1>,<hello, 1>,<me, 1> 分区,默认只有一个分区 排序?<hello, 1>,<hello, 1>,<me, 1><you, 1> 分组?把相同key的value放到一个集合中?<he...
分类:其他好文   时间:2015-01-05 22:05:31    阅读次数:138
Hadoop学习笔记(2)
Hadoop序列化:Long 和Int---变长编码的方法: 如果整数在[ -112, 127] ,所需字节数为1,即第一个字节数就表示该值。 如果大于127,则第一个字节数在[-120,-113]之内,正数字节数为(-112-第一个字节)---最多八个字节。 如果小于-112,则第一个字节数在[-...
分类:其他好文   时间:2014-12-19 17:19:27    阅读次数:151
Hadoop学习笔记(1)
Doug Cutting Lucene(索引引擎)---Nutch(搜索Data抓取)---Hadoop 1997:Lucene 2003:GFS 2004:NDFS\MapReduce\Nutch 2006: (Yahoo! Facebook NewYorkTimes) Hadoop 2008: ...
分类:其他好文   时间:2014-12-19 15:43:43    阅读次数:149
Hadoop学习笔记之Hadoop伪分布式环境搭建
搭建为伪分布式Hadoop环境 1、宿主机(Windows)与客户机(安装在虚拟机中的Linux)网络连接。 a) Host-only 宿主机与客户机单独组网; 好处:网络隔离; 坏处:虚拟机和其他服务器之间不能通讯; b) Bridge 桥接 宿主机与客户机在同一个局域网中。 好处:窦在同一个局域网,可以互相访问; 坏处:不完全。 2、Hadoop的为分布式安装步骤 a) 设置...
分类:其他好文   时间:2014-10-20 23:25:50    阅读次数:230
Hadoop学习笔记(二)设置单节点集群
本文描述如何设置一个单一节点的 Hadoop 安装,以便您可以快速执行简单的操作,使用 Hadoop MapReduce 和 Hadoop 分布式文件系统 (HDFS)。...
分类:其他好文   时间:2014-10-07 19:00:13    阅读次数:235
hadoop 学习笔记:mapreduce框架详解(转 http://www.cnblogs.com/sharpxiajun/p/3151395.html)
开始聊mapreduce,mapreduce是hadoop的计算框架,我学hadoop是从hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密。这个可能是我做技术研究的思路有关,我开始学习某一套技术总是想着这套技术到底能干什么,只有当我真正理解了这套....
分类:Web程序   时间:2014-09-22 20:46:13    阅读次数:286
Hadoop学习笔记-关于Hadoop你不得不知道的12个事实
【IT168评论】现如今,Apache Hadoop已经无人不知无人不晓。当年雅虎搜索工程师Doug Cutting开发出这个用以创建分布式计算机环境的开源软件库,并以自己儿子的大象玩偶为其命名的时候,谁能想到它有一天会占据“大数据”技术的头把交椅呢。 虽然Hadoop伴随大数据一同火爆起来,但相....
分类:其他好文   时间:2014-09-04 14:48:49    阅读次数:160
hadoop学习笔记之--- HDFS原理学习
HDFSHDFS设计基础与目标:冗余:硬件错误是常态流式数据访问。即数据比量读取而非随机读写,Hadoop擅长做的是数据分析而不是事务处理。大规模数据集简单一致性模型。为了降低系统复杂程度,对文件采用一次性写多多次读的逻辑设置,即是文件一经写入,关闭,再也不能修改。程序采..
分类:其他好文   时间:2014-09-04 02:58:58    阅读次数:277
191条   上一页 1 ... 14 15 16 17 18 ... 20 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!