HBase是一个分布式的、面向列的开源数据库,该技术来源于Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBas...
分类:
其他好文 时间:
2014-08-23 17:37:31
阅读次数:
323
1? Protocol Buffers的介绍 Protocol Buffers是一种用于序列化结构化数据的机制,它具有灵活、高效、自动化的特点。类似于XML,但是比XML更小巧、快捷、简单。在Google?几乎所有它内部的RPC协议和文件格式都是采...
分类:
其他好文 时间:
2014-08-19 13:01:56
阅读次数:
232
通过两天对XML的初步认识,对于XML的发展、应用及相关的扩展,做一下总结,
XML:可扩展标记语言,标准通用标记语言的子集,一种用于标记电子文件使其具有结构性的标记语言。
它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。 它非常适合万维网传输,提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。
首先,...
分类:
其他好文 时间:
2014-08-18 18:36:32
阅读次数:
173
Oracle Golden Gate软件是一种基于日志的结构化数据复制备份软件,它通过解析源数据库在线日志或归档日志获得数据的增量变化,再将这些变化应用到目标数据库,从而实现源数据库与目标数据库同步。Oracle Golden Gate可以在异构的IT基础结构(包括几乎所有常用操作系统平台和数据库平...
分类:
其他好文 时间:
2014-08-18 18:28:02
阅读次数:
235
互联网的内容主流,已经出现从文字转向图片的趋势,这标志着互联网已经进入“读图时代”。在“读图时代”的大背景下,图像中的海量非结构化数据的挖掘成为价值潜力的集聚地,如何挖掘其中隐藏的用户“密码”,成为大数据“落地”遇到的一大挑战。 图片大数据挖掘,主要目标是从中提取出图片的自身特征,包括语义、质...
分类:
其他好文 时间:
2014-08-14 16:37:58
阅读次数:
242
Hive 运行架构
由Facebook开源,最初用于解决海量结构化的日志数据统计问题:ETL工具;
构建于Hadoop的HDFS和MapReduce智商,用于管理和查询结构化/非结构化数据的数据仓库;
设计目的是让SQL技能良好,但Java技能较弱的分析师可以查询海量数据:
使用HQL作为查询接口;
使用HDFS作为存储底层;...
分类:
其他好文 时间:
2014-08-12 19:05:44
阅读次数:
314
如果字段或字段组合k是表M的主键,而k也同时存在于表B,则k就是B的外键。外键维系着表之间的关联关系,是结构化数据计算最重要的概念之一。集算器可以通过对象引用方便地实现外键功能,下面用几个例子来说明:例1关联主子表1:订单表(order)是子表,员工表(emp)是主表,请..
分类:
其他好文 时间:
2014-08-12 17:42:05
阅读次数:
228
一、Protocol Buffers简介现在开源的《烽烟OL》的通信协议采用的是Google 的Protocol Buffers,Protocol Buffers(以下简称PB)是一种用于序列化结构化数据的机制,可用于用于分布式应用之间的数据通信或者异构环境下的数据交换。它具有灵活、高效、自动化的特...
分类:
其他好文 时间:
2014-08-10 15:20:40
阅读次数:
211
GoldenGate软件是一种基于日志的结构化数据复制软件,它通过解析源数据库在线日志或归档日志获得数据的增量变化,再将这些变化应用到目标 数据库,从而实现源数据库与目标数据库同步。GoldenGate 可以在异构的IT基础结构(包括几乎所有常用操作系统平台和数据库平台)之间实现大量数据亚秒一级的实...
分类:
数据库 时间:
2014-08-10 12:47:20
阅读次数:
241
1、关系模型(结构化数据类型) 关系模型 实体-关系模型 对象关系模型:基于对象的数据类型 半结构化数据模型:xml(扩展标记语言)2、SQL分为这样的几类DML:数据操作语言,像增删查改INSERT、DELETE、SELECT、UPDATEDDL:数据定义语言,定义的是数据库对象,这样的对...
分类:
数据库 时间:
2014-08-05 10:42:59
阅读次数:
224