码迷,mamicode.com
首页 >  
搜索关键字:rdd spark hive hadoop    ( 23938个结果
09 spark连接mysql数据库
1.安装启动检查Mysql服务。netstat -tunlp (3306) 2.spark 连接mysql驱动程序。–cp /usr/local/hive/lib/mysql-connector-java-5.1.40-bin.jar /usr/local/spark/jars 3.启动 Mysql ...
分类:数据库   时间:2021-06-02 15:40:05    阅读次数:0
2、linux Hadoop集群环境配置ssh无密码验证
集群网络配置 分别设置修改主机名 master slave1 slave2 hostnamectl set-hostname 名字 分别配置/etc/hosts文件 查看openssh和rsync安装 rpm -qa | grep 名字 切换到Hadoop用户 各节点生成秘钥 ssh-keygen ...
分类:系统相关   时间:2021-06-02 15:27:52    阅读次数:0
Spark任务提交和执行流程
本文转自:https://www.cnblogs.com/chhyan-dream/p/12013463.html 1、概述 为了更好地理解调度,我们先看一下集群模式的Spark程序运行架构图,如上所示: 2、Spark中的基本概念 1、Application:表示你的程序 2、Driver:表示m ...
分类:其他好文   时间:2021-06-02 15:22:12    阅读次数:0
09 spark连接mysql数据库
安装启动检查Mysql服务。 netstat -tunlp (3306) spark 连接mysql驱动程序。 –cp /usr/local/hive/lib/mysql-connector-java-5.1.40-bin.jar /usr/local/spark/jars 启动 Mysql she ...
分类:数据库   时间:2021-06-02 15:02:56    阅读次数:0
hadoop实践
hadoop 1.0 1. 创建用户hadoop 2. 下载: curl -o hadoop-1.2.1-bin.tar.gz https://archive.apache.org/dist/hadoop/common/hadoop-1.2.1/hadoop-1.2.1-bin.tar.gz 3. ...
分类:其他好文   时间:2021-06-02 14:05:53    阅读次数:0
六款超好用的大数据分析工具
一、大数据分析工具——Hadoop Hadoop是一个能够对大量数据进行分布式处理的软件框架。但是Hadoop是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop是高效的,因为它 ...
分类:其他好文   时间:2021-06-02 13:17:23    阅读次数:0
08 学生课程分数的Spark SQL分析
读学生课程分数文件chapter4-data01.txt,创建DataFrame。 一、用DataFrame的操作完成以下数据分析要求 每个分数+5分。 总共有多少学生? 总共开设了哪些课程? 每个学生选修了多少门课? 每门课程有多少个学生选? 每门课程大于95分的学生人数? Tom选修了几门课?每 ...
分类:数据库   时间:2021-06-02 12:16:19    阅读次数:0
头歌(Educoder)实践教学平台——Hive综合应用案例
说明 适用平台:头歌(Educoder)实践教学平台 适用实训: Hive综合应用案例——学生成绩查询 Hive综合应用案例——用户学历查询 Hive综合应用案例——用户搜索日志分析 注意: 看清楚上面说的实训是不是和你需要做的实训是同一个实训!!! 如果是同一个实训,直接复制粘贴代码,然后点击测评 ...
分类:其他好文   时间:2021-06-02 11:35:33    阅读次数:0
Spark 通过 jdbc 写入 Clickhouse
说明 使用了自定义的数据库连接池,没有对连接做timeout处理,以后再完善。 由于jdbc不能完全支持clickhouse中的数据类型,采用raw sql的方式处理。 后期考虑封装Java对象到Clickhouse数据类型的映射。 插入时应采用批量写入,例子中的代码仅为测试目的,没有做封装。 <d ...
分类:数据库   时间:2021-06-02 10:35:03    阅读次数:0
2021.05.24用DataFrame的操作或SQL语句完成以下数据分析要求,并和用RDD操作的实现进行对比
分数+5分。 总共有多少学生? 总共开设了哪些课程? 每个学生选修了多少门课? 每门课程有多少个学生选? 每门课程大于95分的学生人数? Tom的成绩按分数大小排序。 平均分: 求每门课的选修人数及平均分,精确到2位小数。每门课的不及格人数,通过率 ...
分类:数据库   时间:2021-05-25 17:47:46    阅读次数:0
23938条   上一页 1 ... 8 9 10 11 12 ... 2394 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!