大数据这个词越来越热,本人一直想学习一下,正巧最近有时间了解一下。先从hadoop入手,在此记录学习中的点滴。 什么是hadoop? What Is Apache Hadoop? The Apache? Hadoop® project develops open-source software fo ...
分类:
其他好文 时间:
2017-04-24 23:24:34
阅读次数:
403
HBase出现的原因: HBase作为面向列的数据库运行在HDFS之上,HDFS缺乏随即读写操作,HBase正是为此而出现。HBase以Google BigTable为蓝本,以键值对的形式存储。项目的目标就是快速在主机内数十亿行数据中定位所需的数据并访问它。 HBase是一个数据库,一个NoSql的 ...
分类:
其他好文 时间:
2017-03-29 19:10:16
阅读次数:
161
原文地址:http://blog.csdn.net/opennaive/article/details/7514146 江湖传说永流传:谷歌技术有"三宝",GFS、MapReduce和大表(BigTable)! 谷歌在03到06年间连续发表了三篇很有影响力的文章,分别是03年SOSP的GFS,04年 ...
分类:
其他好文 时间:
2017-03-27 16:36:16
阅读次数:
234
原文地址: http://blog.csdn.net/opennaive/article/details/7532589 2006年的OSDI有两篇google的论文,分别是BigTable和Chubby。Chubby是一个分布式锁服务,基于Paxos算法;BigTable是一个用于管理结构化数据的 ...
分类:
其他好文 时间:
2017-03-27 16:34:21
阅读次数:
247
1、使用dual配合connect by level 但是有connect by level有上限,如果超出上限,系统会报,"connect by level"内存不足,我试过1000000万数据可以,但是再多就不行了。 2、 使用xmltable,"CONNECT BY 操作内存不足,10g开始支 ...
分类:
数据库 时间:
2017-03-20 00:17:05
阅读次数:
171
⒈GFS(Google File System)。一个分布式文件系统,隐藏下层负载均衡,冗余复制等细节,对上层程序提供一个统一的文件系统API接口。Google根据自己的需求对它进行了特别优化,包括:超大文件的访问,读操作比例远超过写操作,PC机极易发生故障造成节点失效等。GFS把文件分成64MB的 ...
分类:
其他好文 时间:
2017-03-14 13:17:05
阅读次数:
288
HBase HBase 是 Apache Hadoop 中的一个子项目,属于 bigtable 的开源版本,所实现的语言为Java(故依赖 Java SDK)。HBase 依托于 Hadoop 的 HDFS(分布式文件系统)作为最基本存储基础单元。 HBase在列上实现了 BigTable 论文提到 ...
分类:
数据库 时间:
2017-03-03 10:55:23
阅读次数:
223
理解HBase(一个开源的Google的BigTable实际应用)最大的困难是HBase的数据结构概念究竟是什么?首先HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库.另一个不同的是HBase基于列的而不是基于行的模式. Google's BigTable论文 清楚地解释了什 ...
分类:
其他好文 时间:
2017-01-12 18:21:44
阅读次数:
316
转自:http://www.cnblogs.com/haippy/archive/2011/12/04/2276064.html 有时间再好好看下整个文章! 说起LevelDb也许您不清楚,但是如果作为IT工程师,不知道下面两位大神级别的工程师,那您的领导估计会Hold不住了:Jeff Dean和S ...
分类:
数据库 时间:
2016-12-21 18:28:59
阅读次数:
420
大家知道MapReduce是奠定GOOGLE成功基础的三大技术法宝之一(另外两个是PageRank和BigTable),现在MapReduce方法论已经在网络开发甚至在企业开发中得到广泛的应用,而本文则探讨MapReduce在MES PLC编程中的应用。 目前PLC和自动化技术在MES的应用中非常关 ...
分类:
其他好文 时间:
2016-12-14 21:14:57
阅读次数:
168