首先给大家介绍使用文件如何对数据进行存储,Activity提供了openFileOutput()方法可以用于把数据输出到文件中,具体的实现过程与在J2SE环境中保存数据到文件中是一样的。public class FileActivity extends Activity { @Override pu...
分类:
其他好文 时间:
2014-08-18 14:14:12
阅读次数:
141
1、为什么需要Hadoop
目前,一块硬盘容量约为1TB,读取速度约为100M/S,因此完成一块硬盘的读取需时约2.5小时(写入时间更长)。若把数据放在同一硬盘上,且全部数据均需要同一个程序进行处理,此程序的处理时间将主要浪费在I/O时间上。
在过去几十年,硬盘的读取速度并未明显增长,而网络传输速度此飞速上升。
因此,若把数据分散到多个硬盘上进行存储(如分成100份存...
分类:
其他好文 时间:
2014-08-17 19:59:32
阅读次数:
394
Cassandra 的数据存储结构 Cassandra 的数据模型是基于列族(Column Family)的四维或五维模型。它借鉴了 Amazon 的 Dynamo 和 Google‘s BigTable 的数据结构和功能特点,采用 Memtable 和 SSTable 的方式进行存储...
分类:
其他好文 时间:
2014-08-17 01:14:11
阅读次数:
363
目标
实现记录执行存储过程的开始时间,结束时间,运行状态,错误信息等,以函数封装日志记录的方式,存储调用函数...
分类:
其他好文 时间:
2014-08-16 08:34:00
阅读次数:
244
Hive常用的存储类型有:1、TextFile: Hive默认的存储类型;文件大占用空间大,未压缩,查询慢;2、Sequence File:3、RCFile:facebook开发的一个集行存储和列存储的优点于一身,压缩比更高,读取列更快,它在mr环境中大规模数据处理中扮演着重要的角色;是一种行列存储...
分类:
其他好文 时间:
2014-08-14 16:01:08
阅读次数:
283
C++ STL中Map的按Key排序和按Value排序 map是用来存放键值对的数据结构,可以很方便快速的根据key查到相应的value。假如存储学生和其成绩(假定不存在重名,当然可以对重名加以区分),我们用map来进行存储就是个不错的选择。 我们这样定义,map,其中学生姓名用string类型.....
分类:
编程语言 时间:
2014-08-13 14:24:36
阅读次数:
304
1.Sed简介sed是 一种在线编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(patternspace),接着用sed命令处 理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定...
分类:
其他好文 时间:
2014-08-12 18:47:54
阅读次数:
241
在java中,能够使用InputStream对文件进行读取,就是字节流的输入。当读取文件内容进程序时,须要使用一个byte数组来进行存储,如此会有例如以下两个问题:1.怎样建立合适大小的byte数组,假设已知输入流的大小。2.假设不知输入流的大小,则肯定须要建立一个非常大的byte数组,那么byte...
分类:
其他好文 时间:
2014-08-12 16:23:44
阅读次数:
160
1. Sed简介sed 是一种在线编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有 改变,除非你使用...
分类:
其他好文 时间:
2014-08-12 13:12:14
阅读次数:
223
本文介绍了Facebook公司数据分析系统中的RCFile存储结构,该结构集行存储和列存储的优点于一身,在 MapReduce环境下的大规模数据分析中扮演重要角色。Facebook曾在2010 ICDE(IEEE International Conference on Data Engineerin...
分类:
其他好文 时间:
2014-08-10 10:18:00
阅读次数:
315