摘要:CarbonData 在 Apache Spark 和存储系统之间起到中介服务的作用,为 Spark 提供的4个重要功能。 本文分享自华为云社区《Make Apache Spark better with CarbonData》,原文作者:大数据修行者 。 Spark 无疑是一个强大的处理引擎 ...
分类:
Web程序 时间:
2021-06-30 18:44:44
阅读次数:
0
参考集成模式 环境准备 基于docker 运行 spark 环境准备 docker run -it -p 8080:8080 datamechanics/spark:jvm-only-3.1-latest sh // 启动master /opt/spark/sbin/start-master.sh ...
分类:
其他好文 时间:
2021-06-25 16:43:35
阅读次数:
0
什么是任务调度 大数据平台技术框架支持的开发语言多种多样,开发人员的背景差异也很大,这就产生出很多不同类型的程序(任务)运行在大数据平台之上,如:MapReduce、Hive、Pig、Spark、Java、Shell、Python 等。 这些任务需要不同的运行环境,并且除了定时运行,各种类型之间的任 ...
分类:
其他好文 时间:
2021-06-23 17:16:53
阅读次数:
0
1.spark内存分配 MemoryManager |__StaticMemoryManager 静态内存管理机制 |__UnifiedMemoryManger 统一内存管理机制 1.静态内存管理机制 静态内存管理机制实现起来较为简单,但没有根据具体的数据规模和计算任务做相应的配置,很容易造成"一半 ...
分类:
其他好文 时间:
2021-06-23 17:02:31
阅读次数:
0
spark-RDD缓存,checkpoint机制,有向无环图,stage 1.RDD依赖关系 RDD依赖关系有2种不同类型,窄依赖和宽依赖。 窄依赖(narrow dependency):是指每个父RDD的Partition最多被子RDD一个Partition使用。就好像独生子女一样。窄依赖的算子包 ...
分类:
其他好文 时间:
2021-06-22 18:39:47
阅读次数:
0
1. MongoDB相关概念 1.1 业务应用场景 传统的关系型数据库(如MySQL),在数据操作的“三高”需求以及应对Web2.0的网站需求面前,显得力不从心。 解释:“三高”需求: High performance - 对数据库高并发读写的需求。 Huge Storage - 对海量数据的高效率 ...
分类:
数据库 时间:
2021-06-20 17:35:12
阅读次数:
0
准备:1. 规划3个集群节点:hosts主机都已经配置好映射,映射主机名分别为master,slave1,slave2,且已经进行ssh免密配置,确保端口互通,防火墙关闭 2. 先安装好scala(参考:https://www.cnblogs.com/sea520/p/13518158.html) ...
分类:
其他好文 时间:
2021-06-19 19:11:31
阅读次数:
0
import axios from "axios";//axios引入 import { Message } from "element-ui";//message组件引入 import router from "../router";//路由 // 创建axios实例 const service ...
分类:
移动开发 时间:
2021-06-19 18:40:48
阅读次数:
0
spark程序初始化HiveContext报错:空指针异常 版本说明: spark: 1.6.1 scala: 2.10.8 hive: 1.2.1 报错信息 java.lang.RuntimeException: java.lang.NullPointerException at org.apac ...
分类:
其他好文 时间:
2021-06-17 16:37:17
阅读次数:
0
存储区域网络(Storage Area Network,简称SAN)采用网状通道(Fibre Channel ,简称FC,区别与Fiber Channel光纤通道)技术,通过FC交换机连接存储阵列和服务器主机,建立专用于数据存储的区域网络。以下介绍WWN,WWNN,WWPN的意义与区别:WWN: w ...
分类:
其他好文 时间:
2021-06-15 18:15:20
阅读次数:
0