【推荐系统算法实战】 基于网页的 Notebook:Zeppelin 交互式数据分析 如果有一个工具,可以让你在同一个Web页面上写Shell代码,Python代码,Scala代码,你想要么? 如果还可以执行PySpark代码和Spark代码呢?心动了吗? 如果还可以写Hive-SQL,Spark- ...
分类:
编程语言 时间:
2021-07-02 15:35:46
阅读次数:
0
#[derive(Debug, Clone)] struct Work { //消息实体,存储消息 id: i32 } struct WorkMaster { //消息管理者属性 workers: Vec<Box<Worker>> //存储注册的接收者。每个接收者须实现Worker接口才能注册进。 ...
分类:
数据库 时间:
2021-07-01 16:45:32
阅读次数:
0
摘要:CarbonData 在 Apache Spark 和存储系统之间起到中介服务的作用,为 Spark 提供的4个重要功能。 本文分享自华为云社区《Make Apache Spark better with CarbonData》,原文作者:大数据修行者 。 Spark 无疑是一个强大的处理引擎 ...
分类:
Web程序 时间:
2021-06-30 18:44:44
阅读次数:
0
Worker类:静态Worker统一管理实例worker 代码细节 $this->workerId = \spl_object_hash($this); static::$_workers[$this->workerId] = $this; static::$_pidMap[$this->worke ...
分类:
其他好文 时间:
2021-06-29 16:00:44
阅读次数:
0
最近新配了一个主机(开心😊) 配置: CPU Intel(R) Core(TM) i7-10700KF CPU @ 3.80GHz 3.79 GHz 主板 微星z490 S01 内存 金士顿 (Kingston) 16GB(8G×2) DDR4 3200 台式机内存条 骇客神条 Fury雷电系列 ...
参考集成模式 环境准备 基于docker 运行 spark 环境准备 docker run -it -p 8080:8080 datamechanics/spark:jvm-only-3.1-latest sh // 启动master /opt/spark/sbin/start-master.sh ...
分类:
其他好文 时间:
2021-06-25 16:43:35
阅读次数:
0
什么是任务调度 大数据平台技术框架支持的开发语言多种多样,开发人员的背景差异也很大,这就产生出很多不同类型的程序(任务)运行在大数据平台之上,如:MapReduce、Hive、Pig、Spark、Java、Shell、Python 等。 这些任务需要不同的运行环境,并且除了定时运行,各种类型之间的任 ...
分类:
其他好文 时间:
2021-06-23 17:16:53
阅读次数:
0
1.spark内存分配 MemoryManager |__StaticMemoryManager 静态内存管理机制 |__UnifiedMemoryManger 统一内存管理机制 1.静态内存管理机制 静态内存管理机制实现起来较为简单,但没有根据具体的数据规模和计算任务做相应的配置,很容易造成"一半 ...
分类:
其他好文 时间:
2021-06-23 17:02:31
阅读次数:
0
spark-RDD缓存,checkpoint机制,有向无环图,stage 1.RDD依赖关系 RDD依赖关系有2种不同类型,窄依赖和宽依赖。 窄依赖(narrow dependency):是指每个父RDD的Partition最多被子RDD一个Partition使用。就好像独生子女一样。窄依赖的算子包 ...
分类:
其他好文 时间:
2021-06-22 18:39:47
阅读次数:
0
准备:1. 规划3个集群节点:hosts主机都已经配置好映射,映射主机名分别为master,slave1,slave2,且已经进行ssh免密配置,确保端口互通,防火墙关闭 2. 先安装好scala(参考:https://www.cnblogs.com/sea520/p/13518158.html) ...
分类:
其他好文 时间:
2021-06-19 19:11:31
阅读次数:
0