码迷,mamicode.com
首页 >  
搜索关键字:大数据开发 Hadoop Spark    ( 19831个结果
【推荐系统算法实战】 基于网页的 Notebook:Zeppelin 交互式数据分析Zeppelin简介环境安装快速开始Kotlin 开发者社区
【推荐系统算法实战】 基于网页的 Notebook:Zeppelin 交互式数据分析 如果有一个工具,可以让你在同一个Web页面上写Shell代码,Python代码,Scala代码,你想要么? 如果还可以执行PySpark代码和Spark代码呢?心动了吗? 如果还可以写Hive-SQL,Spark- ...
分类:编程语言   时间:2021-07-02 15:35:46    阅读次数:0
看CarbonData如何用四招助力Apache Spark
摘要:CarbonData 在 Apache Spark 和存储系统之间起到中介服务的作用,为 Spark 提供的4个重要功能。 本文分享自华为云社区《Make Apache Spark better with CarbonData》,原文作者:大数据修行者 。 Spark 无疑是一个强大的处理引擎 ...
分类:Web程序   时间:2021-06-30 18:44:44    阅读次数:0
HDFS01 概述
HDFS 概述 HDFS的产生背景和定义 HDFS产生背景 解决海量数据的存储问题 需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。HDFS 只是分布式文件管理系统中的一种。 HDFS定义 HDFS(Hadoop Distributed File System),它是一个文件系统,用于 ...
分类:其他好文   时间:2021-06-30 17:40:30    阅读次数:0
Hadoop复习第五章MapReduce
1.会编程,参考实验 1.1编程实现词频统计基本操作 主函数 public static void main(String[] args) throws Exception{ Configuration conf = new Configuration(); //程序运行时参数 String[] o ...
分类:其他好文   时间:2021-06-29 16:02:29    阅读次数:0
Hadoop复习-常用的HDFS操作
1、列出子目录或子文件 hdfs dfs -ls +路径 2、创建目录(-p表示父目录都会创建) hdfs dfs -mkdir -p /001/mydemo/x/y/z hdfs dfs -mkdir /001/mydemo3 /001/mydemo4 /001/mydemo5 3、列出文件夹中的 ...
分类:其他好文   时间:2021-06-28 21:04:34    阅读次数:0
Hadoop期末复习(第二章)
第二章.HDFS 1.大数据的两个核心技术 2.HDFS设计目标 3.HDFS自身的局限性 4.HDFS采用块设计以及采用块设计的好处 5.HDFS组成架构 6.元数据信息被持久化到磁盘分为哪两个文件 7.第二名称节点的作用 8.名称节点,数据节点的功能 待补充 9.副本机制、数据容错机制、心跳机制 ...
分类:其他好文   时间:2021-06-28 20:29:20    阅读次数:0
并发编程-ThreadLocal&ForkJoinPool(使用以及原理分析)
并发编程-ThreadLocal&ForkJoinPool(使用以及原理分析) 本章只要聊聊两个东西,这里会给出如何使用他们,并且分析各自的源码以及原理。 【ThreadLocal】:在指定线程中存储数据,数据存储后只有指定线程可以获得 【ForkJoinpool】:实际上他类似于【hadoop】他 ...
分类:其他好文   时间:2021-06-28 18:58:16    阅读次数:0
Hadoop期末考复习第一章-概论
一、大数据的基本特征(4V,存储单位) 二、大数据对思维方式的影响 三、Google 三辆马车是什么? Google的文件系统GFS(Google File System)、分布式计算框架MapReduce、Bigtable 四、Hadoop 是什么,基本特征 基本特征: 五、Hadoop 生态系统 ...
分类:其他好文   时间:2021-06-28 18:27:13    阅读次数:0
Hadoop入门 集群时间同步
集群时间同步 **如果服务器在公网环境(能连接外网),可以不采用集群时间同步。**因为服务器会定期和公网时间进行校准。 如果服务器在内网环境,必须要配置集群时间同步,否则时间久了,会产生时间偏差,导致集群执行任务时间不同步。 时间服务器配置(必须root用户) 首先需要设置一个时间服务器作为基准,其 ...
分类:其他好文   时间:2021-06-28 17:56:59    阅读次数:0
delta lake minio+dremio 集成试用
参考集成模式 环境准备 基于docker 运行 spark 环境准备 docker run -it -p 8080:8080 datamechanics/spark:jvm-only-3.1-latest sh // 启动master /opt/spark/sbin/start-master.sh ...
分类:其他好文   时间:2021-06-25 16:43:35    阅读次数:0
19831条   上一页 1 2 3 4 ... 1984 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!