码迷,mamicode.com
首页 >  
搜索关键字:大数据开发 Hadoop Spark    ( 19831个结果
记Hive SQL中TEMPORARY VIEW的一个数据对不上的坑
问题背景: (无关操作已省略) Spark ETL执行以下SQL: CREATE TEMPORARY VIEW A select user_id, ...; CREATE TEMPORARY VIEW B select user_id, ... from A ...; INSERT OVERWRIT ...
分类:数据库   时间:2020-12-29 11:28:30    阅读次数:0
hadoop介绍-架构
hadoop1.X架构 架构模型 分布式文件系统核心模块: namenode:集群中的主节点,管理元数据(文件的大小,文件的位置,文件的权限)。 secondaryNameNode:辅助namenode管理元数据信息。 dadanode:集群当中的从节点,主要存储集群中的各种数据。 分布式数据计算核 ...
分类:其他好文   时间:2020-12-28 11:29:22    阅读次数:0
Hive中的UDF详解
hive作为一个sql查询引擎,自带了一些基本的函数,比如count(计数),sum(求和),有时候这些基本函数满足不了我们的需求,这时候就要写hive hdf(user defined funation),又叫用户自定义函数。 UDF 创建与使用步骤 继承org.apache.hadoop.hiv ...
分类:其他好文   时间:2020-12-25 13:07:42    阅读次数:0
win10+centos7+hadoop 集群环境搭建
一. 前期准备 1. Vmware workstation pro 16 官网下载 : https://www.vmware.com/ 密钥:ZF3R0-FHED2-M80TY-8QYGC-NPKYF (若失效请自行百度) 2. xshell,xftp 官网下载(需要注册) 3. 国内镜像网站下载c ...
分类:Windows程序   时间:2020-12-25 12:00:06    阅读次数:0
学好Spark/Kafka必须要掌握的Scala技术点(三)高阶函数、方法、柯里化、隐式转换
建议在用Scala编写相关功能实现时,边学习、边应用、边摸索以加深对Scala的理解和应用 ...
分类:其他好文   时间:2020-12-21 11:32:22    阅读次数:0
CentOS 7 配置hadoop(五) 配置sqoop(伪分布)
章节: 第一章节:CentOS 7 配置hadoop(一) 安装虚拟机(伪分布) 第二章节:CentOS 7 配置hadoop(二) 配置hdfs(伪分布) 第三章节:CentOS 7 配置hadoop(三) 配置hbase(伪分布) 第四章节:CentOS 7 配置hadoop(四) 配置hive ...
分类:其他好文   时间:2020-12-21 11:30:46    阅读次数:0
hadoop Shuffle Error: Exceeded MAX_FAILED_UNIQUE_FETCHES; bailing-out
hadoop Shuffle Error: Exceeded MAX_FAILED_UNIQUE_FETCHES; bailing-out 程序里面需要打开多个文件,进行分析,系统一般默认数量是1024,(用ulimit -a可以看到)对于正常使用是够了,但是对于程序来讲,就太少了。修改办法:修改2 ...
分类:其他好文   时间:2020-12-19 13:37:26    阅读次数:3
学好Spark/Kafka必须要掌握的Scala技术点(二)类、单例/伴生对象、继承和trait,模式匹配、样例类(case class)
Scala是以JVM为运行环境的面向对象的函数式编程语言,它可以直接访问Java类库并且与Java框架进行交互操作 ...
分类:其他好文   时间:2020-12-19 13:14:39    阅读次数:1
hdfs的相关api
连接hdfs 根据hdfs的版本引用相关的hdfs依赖 <!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-client --> <dependency> <groupId>org.apache.hadoop</group ...
分类:Windows程序   时间:2020-12-18 13:06:56    阅读次数:4
如何在 Serverless K8s 集群中低成本运行 Spark 数据计算?
本节课主要介绍如何在 Serverless Kubernetes 集群中低成本运行 Spark 数据计算。首先简单介绍下阿里云 Serverless Kubernetes 和 弹性容器实例 ECI 这两款产品;然后介绍 Spark on Kubernetes;最后进行实际演示。
分类:其他好文   时间:2020-12-17 12:22:18    阅读次数:2
19831条   上一页 1 ... 23 24 25 26 27 ... 1984 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!