对现有数据体系整理优化的探索。 目前现有体系为生产数据库为ORACLE,分析平台数据库为基于HADOOP平台开发,两个平台并行运行。 基于业务要求,生产ORACLE按一定期限会删除数据,而分析平台则保存历史所有但是会做了脱敏处理,只满足分析使用,目前架构整理如下: ...
分类:
其他好文 时间:
2020-04-08 21:06:16
阅读次数:
137
在hive建表中,默认的分隔符为 ‘,’ ,可以指定想用的分隔符 hive默认的列分割类型为org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe,这其实就是^A分隔符,hive中默认使用^A(ctrl+A)作为列分割符,如果用户需要指定的话,等同于ro ...
分类:
其他好文 时间:
2020-04-08 11:40:18
阅读次数:
267
开发工具:Eclipse,三步1.新建一个项目2.把hbase安装下的lib的文件都拷贝进来3.把lib目录下jar文件都引入4.lib下的client-facing-thirdparty目录下的jar也都引入看图packagecom.yue;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.;impo
分类:
编程语言 时间:
2020-04-08 09:36:19
阅读次数:
86
大数据技术开篇之Hadoop入门【hdfs】 学习都是从了解到熟悉的过程,而学习一项新的技术的时候都是从这个技术是什么?可以干什么?怎么用?如何优化?这几点开始。今天这篇文章分为两个部分。一、hadoop概述 二、hadoop核心技术之一的hdfs的讲解。 【hadoop概述】 一、hadoop是什 ...
分类:
其他好文 时间:
2020-04-07 20:10:19
阅读次数:
61
1 package com.liuhuan; 2 3 import org.apache.hadoop.io.WritableComparable; 4 5 import java.io.DataInput; 6 import java.io.DataOutput; 7 import java.io ...
分类:
其他好文 时间:
2020-04-07 18:45:58
阅读次数:
102
[Toc] 一、初识大数据 大数据(BIG DATA),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产 1MB = 1024KB、1GB = 1024MB 1TB = 1024GB、 ...
分类:
其他好文 时间:
2020-04-07 14:19:05
阅读次数:
132
1.shell的操作命令 hdfs命令有两种风格:hadoop fs、hdfs dfs 两种命令均可使用,效果相同。 1)查看子命令 hadoop fs、hdfs dfs 2)如果查看hdfs或hadoop子命令信息 hdfs dfs -help shellCmd hadoop fs -help s ...
分类:
系统相关 时间:
2020-04-07 00:23:00
阅读次数:
155
大数据安全系列的其它文章 https://www.cnblogs.com/bainianminguo/p/12548076.html 安装kerberos https://www.cnblogs.com/bainianminguo/p/12548334.html hadoop的kerberos认证 ...
分类:
其他好文 时间:
2020-04-06 00:21:08
阅读次数:
411
大数据安全系列的其它文章 https://www.cnblogs.com/bainianminguo/p/12548076.html 安装kerberos https://www.cnblogs.com/bainianminguo/p/12548334.html hadoop的kerberos认证 ...
分类:
其他好文 时间:
2020-04-06 00:05:43
阅读次数:
507
http://www.semantikoz.com/blog/lambda-architecture-velocity-volume-big-data-hadoop-storm/ Big data architecture paradigms are commonly separated into ...
分类:
其他好文 时间:
2020-04-05 22:02:51
阅读次数:
90