码迷,mamicode.com
首页 >  
搜索关键字:大数据开发 Hadoop Spark    ( 19831个结果
大数据Hadoop生态圈介绍
转自:https://blog.csdn.net/qq_25062299/article/details/95592877 ...
分类:其他好文   时间:2021-06-19 19:00:51    阅读次数:0
HDFS的读写流程
HDFS的读取过程 HDFS的读取流程大致有以下几个步骤: (1)客户端通过调用FileSystem对象的open()来打开希望读取的文件。对于HDFS平台来说,这个对象是DistributedFileSystem类的是一个实例,所以实际调用的是DistributedFileSystem对象的ope ...
分类:其他好文   时间:2021-06-19 18:42:26    阅读次数:0
聚焦 | 数据湖分析如何面向对象存储OSS进行优化?
简介: 最佳实践,以DLA为例子。DLA致力于帮助客户构建低成本、简单易用、弹性的数据平台,比传统Hadoop至少节约50%的成本。其中DLA Meta支持云上15+种数据数据源(OSS、HDFS、DB、DW)的统一视图,引入多租户、元数据发现,追求边际成本为0,免费提供使用。DLA Lakehou ...
分类:其他好文   时间:2021-06-18 20:06:29    阅读次数:0
Sqoop的数据导出
将数据从HDFS把文件导出到RDBMS数据库 导出前,目标表必须存在于目标数据库中。 默认操作是从将文件中的数据使用INSERT语句插入到表中 更新模式下,是生成UPDATE语句更新表数据 数据是在HDFS当中的如下目录/sqoop/emp,数据内容如下 1201,gopal,manager,500 ...
分类:其他好文   时间:2021-06-18 19:31:03    阅读次数:0
MapReduce(八)Hadoop中的数据本地化
原文链接: https://data-flair.training/blogs/data-locality-in-hadoop-mapreduce/ 1、什么是数据本地化 数据本地化(Data locality)是指将计算移动到数据所在的节点,而不是移动数据移动到计算所在的节点。在Hadoop中,一 ...
分类:其他好文   时间:2021-06-18 19:09:26    阅读次数:0
ubuntu安装配置eclipse+hadoop开发环境(十分详细)+WordCount实例
https://blog.csdn.net/QYmufeng/article/details/79580582 我的环境: 系统平台:Ubuntu14.04TLS(64位) Hadoop环境:Hadoop2.8.3 Eclipse:Neon.2 Release(4.6.2) Eclipse插件:ha ...
分类:系统相关   时间:2021-06-17 17:05:08    阅读次数:0
Spark初始换HiveContext空指针异常
spark程序初始化HiveContext报错:空指针异常 版本说明: spark: 1.6.1 scala: 2.10.8 hive: 1.2.1 报错信息 java.lang.RuntimeException: java.lang.NullPointerException at org.apac ...
分类:其他好文   时间:2021-06-17 16:37:17    阅读次数:0
2020最新Java面试题及答案(带完整目录).pdf
一、JVM 二、Java集合 三、Java多线程并发 四、Java基础 五、Spring原理 六、微服务 七、Netty与RPC 八、网络 九、日志 十、RabbitMQ 十一、MongoDB 十二、设计模式 十三、负载均衡 十四、数据 十五、Java算法 十六、数据结构 十七、Hadoop 十八、 ...
分类:编程语言   时间:2021-06-13 10:00:32    阅读次数:0
大数据开发-Spark Join原理详解
数据分析中将两个数据集进行 Join 操作是很常见的场景。在 Spark 的物理计划阶段,Spark 的 Join Selection 类会根 据 Join hints 策略、Join 表的大小、 Join 是等值 Join 还是不等值以及参与 Join 的 key 是否可以排序等条件来选择最 终的 ...
分类:其他好文   时间:2021-06-10 18:28:12    阅读次数:0
Hadoop 数据迁移用法详解
数据迁移使用场景 冷热集群数据分类存储,详见上述描述. 集群数据整体搬迁.当公司的业务迅速的发展,导致当前的服务器数量资源出现临时紧张的时候,为了更高效的利用资源,会将原A机房数据整体迁移到B机房的,原因可能是B机房机器多,而且B机房本身开销较A机房成本低些等. 数据的准实时同步.数据的准实时同步与 ...
分类:其他好文   时间:2021-06-10 18:05:50    阅读次数:0
19831条   上一页 1 2 3 4 5 6 ... 1984 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!