I am in a bit of a bind (pun intended). I have a ubuntu server running kafka & zookeeper. This server has both ipv4 and ipv6 protocols installed. In t ...
分类:
其他好文 时间:
2021-06-02 12:29:05
阅读次数:
0
说明 适用平台:头歌(Educoder)实践教学平台 适用实训: Hive综合应用案例——学生成绩查询 Hive综合应用案例——用户学历查询 Hive综合应用案例——用户搜索日志分析 注意: 看清楚上面说的实训是不是和你需要做的实训是同一个实训!!! 如果是同一个实训,直接复制粘贴代码,然后点击测评 ...
分类:
其他好文 时间:
2021-06-02 11:35:33
阅读次数:
0
安装准备 Spark 集群和 Hadoop 类似,也是采用主从架构,Spark 中的主服务器进程就叫 Master(standalone 模式),从服务器进程叫 Worker Spark 集群规划如下: node-01:Master node-02:Worker node-03:Worker 安装步 ...
分类:
其他好文 时间:
2021-05-24 17:07:05
阅读次数:
0
启动hive时,show databases; 然后报错: 查看自己的配置文件没有问题(hbase-site.xml中配置的mysql账号信息与mysql账号信息一致),于是乎看别人的解决方法: 第一种解决办法(失败)[1]: 由于没有初始化数据库导致,执行名称初始化数据库,执行命令: schema ...
分类:
数据库 时间:
2021-05-24 16:48:31
阅读次数:
0
方案一:手动拷贝需要的相关jar包 flume对接HBASE报错,找不到相关的类: 报错hbase相关日志: 18 五月 2021 17:25:50,633 ERROR [lifecycleSupervisor-1-2] (org.apache.flume.lifecycle.LifecycleSu ...
分类:
Web程序 时间:
2021-05-24 15:18:47
阅读次数:
0
分布式协调服务 Zookeeper是分布式协调服务框架 分布式协调技术: 主要用来解决分布式环境当中多个进程之间的同步控制,让进程有序的去访问某种临界资源,防止造成"脏数据"的后果 分布式协调技术的核心就是实现分布式锁 分布式锁 分布式锁: 为了防止分布式系统中的多个进程之间相互干扰,需要分布式协调 ...
分类:
其他好文 时间:
2021-05-24 14:40:54
阅读次数:
0
Zookeeper概念 Zookeeper是分布式协调服务,用于管理大型主机,在分布式环境中协调和管理服务是很复杂的过程,Zookeeper通过简单的架构和API解决了这个问题 Zookeeper实现分布式锁 分布式锁三要素: 加锁 解锁 锁超时 Zookeeper数据结构类似树结构,由节点Znod ...
分类:
其他好文 时间:
2021-05-24 14:40:06
阅读次数:
0
方案一: 如果是集成CDH环境,首先检查/etc/hive/conf目录下是不是有atlas-application.properties文件,如果没有,从atlas路径下copy一份过去 方案二: 如果确认文件已经有了,导入还是报错,强行修改import-hive.sh文件,指定HIVE_CP=/ ...
分类:
其他好文 时间:
2021-05-24 13:38:19
阅读次数:
0
典型架构 很多的场景都是如上的,有web(包括无线、以前CS的模式、现在的BS模式等)、DB、cache、数据分析我就用了Hadoop了(代名词,或者泛指数据仓库了),另外就是一些传感器之类的,数据通道(有的简单如:jdbc等,有的比较复杂,保序不丢等),其中也简单列了一些中间件的软件。这张图组成了 ...
分类:
其他好文 时间:
2021-05-24 09:02:34
阅读次数:
0
1.pandas df 与 spark df的相互转换 df_s=spark.createDataFrame(df_p) df_p=df_s.toPandas() import pandas as pd import numpy as np arr = np.arange(6).reshape(-1 ...
分类:
其他好文 时间:
2021-05-24 08:54:40
阅读次数:
0