首页 > 其他好文 > 详细

Hue添加Spark notebook

时间：2018-08-16 17:43:07 阅读：672 评论：0 收藏：0 [点我收藏+]

参考自https://blogs.msdn.microsoft.com/pliu/2016/06/18/run-hue-spark-notebook-on-cloudera/

说明

使用Cloudera Manager部署CDH群集时，可以使用Hue Web UI运行Hive和Impala查询。但Spark笔记本没有开箱即用。在CDH上安装和配置Spark笔记本并不像现有文档中描述的那样简单。在本博客中，我们将提供有关如何在CDH上使用Livy启用Hue Spark笔记本的分步说明。

在撰写本文时，部署的CDH版本为5.9.3，HUE 3.11和Livy 0.3。对于使用Cloudera Manager部署的任何CDH群集，步骤应该类似。请注意，Cloudera尚不支持Livy。

1.　在cloudera manager集群中找到hue服务

技术分享图片

2.　添加配置　

在Cloudera Manager中，转到Hue - > Configurations，在hue服务高级配置代码段（安全阀）中搜索hue_safety_valve.ini的 “安全” ，添加以下配置，保存更改，然后重新启动Hue：

技术分享图片

[spark]
server_url=http://fp-01:8998
languages=‘[{"name": "Scala Shell", "type": "spark"},{"name": "PySpark Shell", "type": "pyspark"},{"name": "R Shell", "type": "r"},{"name": "Jar", "type": "Jar"},{"name": "Python", "type": "py"},{"name": "Impala SQL", "type": "impala"},{"name": "Hive SQL", "type": "hive"},{"name": "Text", "type": "text"}]‘


[notebook]
show_notebooks=true
enable_batch_execute=true
enable_query_builder=true
enable_query_scheduling=false
 [[interpreters]]
 [[[hive]]]
      # The name of the snippet.
      name=Hive
      # The backend connection to use to communicate with the server.
      interface=hiveserver2

    [[[impala]]]
      name=Impala
      interface=hiveserver2
[[[spark]]]
      name=Scala
      interface=livy

    [[[pyspark]]]
      name=PySpark
      interface=livy
[[[jar]]]
      name=Spark Submit Jar
      interface=livy-batch

    [[[py]]]
      name=Spark Submit Python
      interface=livy-batch
[[[spark2]]]
      name=Spark
      interface=oozie

添加完成之后重启hue服务。

3.　打开hue web ui界面

Hue Web UI，你应该能够看到Spark笔记本。Spark笔记本使用Livy提交Spark工作，所以没有Livy，它还没有运行。

技术分享图片

Hbase Browser：警告原因是因为cdh集群没有安装hbase组件。

Impala：警告原因是因为cdh集群没有安装impala组件。

Spark：警告原因是因为没有安装livy服务。

4.　安装Livy服务

4.1　下载地址

https://github.com/cloudera/livy/releases

4.2　上传到服务器并解压

[root@fp-01 soft]# unzip livy-server-0.3.0.zip -d /opt/

4.3　修改配置文件

[root@fp-01 soft]# cd /opt/livy-server-0.3.0/conf/
[root@fp-01 conf]# vi livy-env.sh

在文件最后添加以下内容

export JAVA_HOME=/opt/jdk1.8.0_151
export SPARK_HOME=/opt/cloudera/parcels/CDH-5.9.3-1.cdh5.9.3.p0.4/lib/spark/
export SPARK_CONF_DIR=/etc/spark2/conf
export HADOOP_CONF_DIR=/etc/hadoop/conf

4.4　配置环境变量

[root@fp-01 conf]# vi /etc/profile

#Livy
export LIVY_HOME=/opt/livy-server-0.3.0
export PATH=$LIVY_HOME/bin:$PATH

立即生效

[root@fp-01 conf]# source /etc/profile

4.5　创建日志文件夹

如果没有创建logs，则启动的时候会报错找不到logs文件夹

[root@fp-01 conf]# cd /opt/livy-server-0.3.0

[root@fp-01 livy-server-0.3.0]# mkdir logs

4.6　后台启动livy

[root@fp-01 conf]# cd /opt/livy-server-0.3.0/bin/
[root@fp-01 bin]# nohup ./livy-server > livy.out 2>&1 &

4.7　查看启动日志

[root@fp-01 bin]# cat livy.out 
nohup: 忽略输入
18/08/16 13:41:23 WARN LivySparkUtils$: Current Spark (2,2) is not verified in Livy, please use it carefully
18/08/16 13:41:23 INFO StateStore$: Using BlackholeStateStore for recovery.
18/08/16 13:41:23 INFO BatchSessionManager: Recovered 0 batch sessions. Next session id: 0
18/08/16 13:41:23 INFO InteractiveSessionManager: Recovered 0 interactive sessions. Next session id: 0
18/08/16 13:41:23 INFO InteractiveSessionManager: Heartbeat watchdog thread started.
18/08/16 13:41:23 INFO WebServer: Starting server on http://fp-01:8998

5.　刷新Hue web UI界面

由于已经启动livy服务，spark警告已经消失

技术分享图片

6.　CDH集群添加hbase和impala组件

技术分享图片

7.　再次刷新Hue web UI界面

此时所有警告已经消失

技术分享图片

8.　点击页面顶部的Notebooks

8.1　发现页面报500错误

技术分享图片

8.2　点击View logs，查看报错日志

有一行报错：NameError：global name ‘SHOW_NOTEBOOKS‘ is not defined

技术分享图片

8.3　点击More info

查看最下面的文件views.py，第68行，问题代码if not SHOW_NOTEBOOKS.get()，但是前面并没有定义，所以报错。

技术分享图片

8.4　查看hue源码

https://github.com/cloudera/hue

https://github.com/cloudera/hue/blob/master/desktop/libs/notebook/src/notebook/views.py

发现是在前面引入

技术分享图片

8.5　修改cdh hue的views.py文件

[root@fp-01 ~]# cd /opt/cloudera/parcels/CDH-5.9.3-1.cdh5.9.3.p0.4/lib/hue/desktop/libs/notebook/src/notebook/
[root@fp-01 notebook]# vi views.py

技术分享图片

8.6　重启hue服务，在hue web UI界面点击notebooks

一切正常

技术分享图片

Hue添加Spark notebook

标签：忽略 OLE code scala top ror entry 步骤支持

原文地址：https://www.cnblogs.com/qingyunzong/p/9488295.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

迷上了代码！

Hue添加Spark notebook

说明

1. 在cloudera manager集群中找到hue服务

2. 添加配置

3. 打开hue web ui界面

4. 安装Livy服务

4.1 下载地址

4.2 上传到服务器并解压

4.3 修改配置文件

4.4 配置环境变量

4.5 创建日志文件夹

4.6 后台启动livy

4.7 查看启动日志

5. 刷新Hue web UI界面

6. CDH集群添加hbase和impala组件

7. 再次刷新Hue web UI界面

8. 点击页面顶部的Notebooks

8.1 发现页面报500错误

8.2 点击View logs，查看报错日志

8.3 点击More info

8.4 查看hue源码

8.5 修改cdh hue的views.py文件

8.6 重启hue服务，在hue web UI界面点击notebooks

1.　在cloudera manager集群中找到hue服务

2.　添加配置　

3.　打开hue web ui界面

4.　安装Livy服务

4.1　下载地址

4.2　上传到服务器并解压

4.3　修改配置文件

4.4　配置环境变量

4.5　创建日志文件夹

4.6　后台启动livy

4.7　查看启动日志

5.　刷新Hue web UI界面

6.　CDH集群添加hbase和impala组件

7.　再次刷新Hue web UI界面

8.　点击页面顶部的Notebooks

8.1　发现页面报500错误

8.2　点击View logs，查看报错日志

8.3　点击More info

8.4　查看hue源码

8.5　修改cdh hue的views.py文件

8.6　重启hue服务，在hue web UI界面点击notebooks