什么是mycat 1、一个彻底开源的,面向企业应用开发的大数据库集群 2、支持事务、ACID、可以替代MySQL的加强版数据库 3、一个可以视为MySQL集群的企业级数据库,用来替代昂贵的Oracle集群 4、一个融合内存缓存技术、NoSQL技术、HDFS大数据的新型SQL Server 5、结合传 ...
分类:
数据库 时间:
2021-04-24 13:26:20
阅读次数:
0
kafka功能简单测试 启动zookeeper 启动zk命令: ./zhServer.sh start 启动akfka(注意server.properties的配置) 启动akfka命令:./kafka-server-start.sh /home/hadoop/app/kafka_2.11-0.9. ...
分类:
其他好文 时间:
2021-04-24 13:16:11
阅读次数:
0
1:下载地址 http://mirrors.hust.edu.cn/apache/sqoop/1.4.6/ 2:上传压缩包 scp sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz root@hadoop2:/opt/software 3:解压并重命名 tar - ...
分类:
其他好文 时间:
2021-04-21 12:09:16
阅读次数:
0
一、词频统计: 1.读文本文件生成RDD lines lines = sc.textFile('file:///home/hadoop/word.txt') 2.将一行一行的文本分割成单词 words flatmap() words=lines.flatMap(lambda line:line.sp ...
分类:
其他好文 时间:
2021-04-20 15:02:06
阅读次数:
0
Docker Hadoop 配置常见错误及解决办法 问题1:wordcount运行卡住,hadoop 任务运行到running job就卡住了 INFO mapreduce.Job: Running job: job_.... 解决如下: 1. 修改mapred-site.xml配置,配置文件在Ha ...
分类:
其他好文 时间:
2021-04-20 14:54:20
阅读次数:
0
Redis基础 NoSQL 学名(not only sql) 特点: 存储结构与MySQL这一种关系型数据库完全不同,NoSQL存储的是key-value形式的数据。 NoSQL有很多产品,都有自己的api和语法,以及业务场景。 产品种类: Mongodb Redis Hbase hadoop No ...
分类:
其他好文 时间:
2021-04-19 14:35:28
阅读次数:
0
HDFS缓存 集中式缓存管理,由Datanode堆外内存组成,Namenode统一管理 优点: 阻止频繁使用的数据从内存中删除 由于是Namenode统一管理,因此在读可以根据情况调度,提高读性能 客户端可以通过零拷贝技术直接读取缓存数据 提高集群内存利用率,读某个文件的时候会将 解决步骤 查看是否 ...
分类:
其他好文 时间:
2021-04-14 12:00:19
阅读次数:
0
1.Spark概述 Apache Spark是一个闪电般快速的实时处理框架。它进行内存计算以实时分析数据。由于 Apache Hadoop MapReduce 仅执行批处理并且缺乏实时处理功能,因此它开始出现。因此,引入了Apache Spark,因为它可以实时执行流处理,也可以处理批处理。 除了实 ...
分类:
其他好文 时间:
2021-04-06 15:01:09
阅读次数:
0
2.1 序列化概述 1)什么是序列化 序列化就是把内存中的对象,转换成字节序列(或其他数据传输协议)以便于存储到磁盘(持久化)和网络传输。 反序列化就是将收到字节序列(或其他数据传输协议)或者是磁盘的持久化数据,转换成内存中的对象。 2)为什么要序列化 一般来说,“活的”对象只生存在内存里,关机断电 ...
分类:
其他好文 时间:
2021-04-06 14:52:31
阅读次数:
0
sentry缺点: 1、组件只支持hive、hdfs、impala 不支持hbase,stome等 show roles; create role admin_zr; 0: jdbc:hive2://cbp5.chinaoly.com:10000/> grant all on server serv ...
分类:
其他好文 时间:
2021-04-06 14:49:20
阅读次数:
0