码迷,mamicode.com
首页 >  
搜索关键字:HDFS    ( 4980个结果
MySQL 中间件Mycat部署
什么是MyCat*一个彻底开源的,面向企业应用开发的大数据库集群*支持事务、ACID、可以替代MySQL的加强版数据库*一个可以视为MySQL集群的企业级数据库,用来替代昂贵的Oracle集群*一个融合内存缓存技术、NoSQL技术、HDFS大数据的新型SQLServer*结合传统数据库和新型分布式数据仓库的新一代企业级数据库产品*一个新颖的数据库中间件产品为什么使用MyCat如今随着互联网的发展,
分类:数据库   时间:2020-07-19 11:27:26    阅读次数:86
Hadoop3.13 配置文件
首先会写出集群的部署规划,然后根据规划编写对应的配置文件 主要包含四个配置文件,包含的,将配置文件改好,然后分发到各个配置文件然后启动集群的时候将会加载配置文件 一、集群的部署规划 hadoop102 hadoop103 hadoop104 HDFS NameNode DataNode DataNo ...
分类:其他好文   时间:2020-07-19 00:55:10    阅读次数:85
datax的安装与使用
1、官网下载地址:https://github.com/alibaba/DataX DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxC ...
分类:其他好文   时间:2020-07-17 22:02:27    阅读次数:140
小需求:看数据源目录下所有gz压缩包的原始大小
今天MR的数据源很可能出现了问题,正常每天对方服务器会推过来2.1TB数据,今天只有1.6TB。 过来是gz压缩包,FTP的方式推送,进来之后我这边的程序进行解析,并存入HDFS。 对端的工程师只能看到压缩包目录的大小,看不到压缩前文件总大小,商量了一下,觉得不好对比数据一致性,想排查数据量问题,没 ...
分类:其他好文   时间:2020-07-17 09:40:37    阅读次数:123
记一次HDFS配置被覆盖的修复步骤
这个事情的背景是公司的Hadoop生态集群都是原生的,不是基于CDH的,所以基本所有的东西都需要自己手动管理,比如集群修改一些属性,然后批量分发重启或者动态生效之类的。这次也算不上事故,因为没对生产环境造成什么影响,但是差一点就变成事故,写出来分享一下。 事情简单概括就是,60+台hadoop的集群 ...
分类:其他好文   时间:2020-07-14 13:10:45    阅读次数:72
Spark学习(二)win10部署Hadoop+Spark
1.Hadoop (1)安装配置 基础只需要配置core-site.xml和hdfs-site.xml就行。 参考: https://www.jianshu.com/p/aa8cfaa26790【这个教程的core-site.xml和hdfs-site.xml的内容弄反了,交换一下就行】 http: ...
分类:Windows程序   时间:2020-07-14 10:32:49    阅读次数:115
Hive入门
Hive是个啥? 用类似sql语句实现对分布式存储系统的数据读写、管理功能。 HIVE特点 1.使用类sql语句分析大数据,避免MapReduce程序分析数据 2.数据存储在HDFS上,不是HIVE上 3.Hive将数据映射成数据库和一张张表,库和表的元数据信息一般存在关系型数据库。 元数据:描述数 ...
分类:其他好文   时间:2020-07-13 12:07:13    阅读次数:73
大数据学习2(MapReduce)
一,执行流程 由图我们可以看到, MapReduce存在以下4个独立的实体。 JobClient:运行于client node,负责将MapReduce程序打成Jar包存储到HDFS,并把Jar包的路径提交到Jobtracker,由Jobtracker进行任务的分配和监控。 JobTracker:运 ...
分类:其他好文   时间:2020-07-12 22:18:50    阅读次数:82
解决HDFS上小文件的存储
从源头上解决,在上传到HDFS之前,就将多个小文件归档 使用tar命令 带上参数-zcvf 示例: tar -zcvf xxx.tar.gz 小文件列表 如果小文件已经上传到HDFS了,可以使用在线归档 使用hadoop archive命令 示例: hadoop archive -archiveNa ...
分类:其他好文   时间:2020-07-11 17:00:14    阅读次数:76
Hive
Hive数据仓库 Facebook由hive和Hadoop组建 hive由facebook开发的 存储HDFS,查询MapReduce 优势 解决了传统关系型数据库在大数据处理上的瓶颈。适合大数据批量处理 充分利用集群的CPU计算资源,存储资源,实现并行计算 Hive支持标准的SQL语法,免去了编写 ...
分类:其他好文   时间:2020-07-10 19:33:44    阅读次数:77
4980条   上一页 1 ... 14 15 16 17 18 ... 498 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!