码迷,mamicode.com
首页 >  
搜索关键字:hadoop 生态系统 概述    ( 44117个结果
Oracle数据库LOGGING&NOLOGGING模式概述
1.日志记录模式(LOGGING、FORCE LOGGING、NOLOGGING)1.1三者的含义LOGGING:当创建一个数据库对象时将记录日志信息到联机重做日志文件。LOGGING实际上是对象的一个属性,用来表示在创建对象时是否记录REDO日志,包括在做DML时是否记录REDO日志。一般表上不建...
分类:数据库   时间:2014-05-01 10:08:53    阅读次数:662
[转载]马化腾:创造生物型组织的七大“灰度法则”
导语:互联网是一个开放交融、瞬息万变的大生态,企业作为互联网生态里面的物种,需要像自然界的生物一样,各个方面都具有与生态系统汇接、和谐、共生的特性。7月9日消息,在腾讯合作伙伴大会举办一周年之际,腾讯公司董事会主席兼CEO马化腾向广大合作伙伴发出公开信,就互联网创新、企业管理等话题进行分享。以下为全...
分类:其他好文   时间:2014-05-01 09:58:31    阅读次数:445
数据结构——概述
本来大一下册的时候学过《数据结构》,只怪自己太无知,除了能够理解基本概念外其他的一无所知,上课也算是在坐飞机吧。无奈,现在大二又来看看,复习复习。不求深入的理解只求把书读薄吧。数据结构是一门研究非数值计算的程序设计问题中的操作对象,以及它们之间的关系和操作等相关问题的科学。基本概念和术语: 数据:....
分类:其他好文   时间:2014-05-01 09:17:05    阅读次数:305
λ演算概述
λ演算(Lambda-calculus)是一套用于研究函数定义、应用和递归的形式系统。它由阿兰佐·丘奇(Alonzo Church)和史蒂芬·科尔·克林(Stephen Cole Kleene)在20世纪三十年代引入。丘奇运用λ演算在1936年给出“判定性问题”(Entscheidungs prob...
分类:其他好文   时间:2014-05-01 03:07:43    阅读次数:343
多线程笔记
一,多线程概述 1. 进程和线程 计算机的核心是CPU,它承担了所有的计算任务.它就像一座工厂,时刻在运行.假定工厂的电力有限,一次只能给一个车间使用,也就是说,一个车间开工的时候,其他车间都必须停工,背后的含义就是,单个CPU一次只能运行一个任务.进程就好比工厂的车间,它代表CPU所能处理的单个任务,任一时刻,CPU总是运行一个进程,其他进程处于非运行状态.一个车间里,可以有很多工人,他们协...
分类:编程语言   时间:2014-04-29 13:43:20    阅读次数:276
HBase伪分布式安装及简单使用
HBase是Hadoop的数据库,基于Hadoop运行,是一种NoSQL数据库。 特点:分布式、多版本、面向列的存储模型,能够大规模的数据实时随机读写,可直接使用本地文件系统。 不适合:与关系型数据库相比,模型简单,API很少;不适合小规模的数据。 数据存放的位置叫做单元(cell),其中的数据可以有多个版本,根据时间戳(timestamp)来区别。 安装: tar xfz hbase-...
分类:其他好文   时间:2014-04-29 13:27:22    阅读次数:403
hadoop生态系统默认端口集合
1 HDFS服务中,默认端口集合:  1. HDFS 端口 Service Servers Default Ports Used Protocol Description Need End User Access? Configuration Parameters NameNode WebUI Master Nodes (NameNo...
分类:其他好文   时间:2014-04-29 13:24:21    阅读次数:492
Hadoop架构设计、运行原理详解
1、Map-Reduce的逻辑过程 假设我们需要处理一批有关天气的数据,其格式如下: 按照ASCII码存储,每行一条记录每一行字符从0开始计数,第15个到第18个字符为年第25个到第29个字符为温度,其中第25位是符号+/- 0067011990999991950051507+0000+ 0043011990999991950051512+0022+ 00430119...
分类:其他好文   时间:2014-04-29 13:22:20    阅读次数:309
cdh4.1.2 hadoop和oozie集成问题
安装oozie的时候,碰到了好多好多问题,都通过网上搜索找到答案解决,在这里总结一下...
分类:其他好文   时间:2014-04-29 13:17:22    阅读次数:353
流水线技术
一、出现流水线原因             由于顺序方式和重叠方式存在着一定的缺陷,因此为了解决这些问题出现了流水方式 二、流水线概述        流水线是只在程序执行时多条指令重叠进行操作的一种准并行处理实现技术。它是把一个重复的过程分解为若干子过程,让多个处理过程在时间上相互错开,轮流重叠的使用同一套硬件设备的各个部件,以赢得处理速度,所以流水线使用的是时间并行。也就是说准并行并...
分类:其他好文   时间:2014-04-29 13:15:20    阅读次数:332
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!