搜索关键字：大数据开发 Hadoop Spark，搜索到19831个结果！码迷,mamicode.com！

MapReduce基本原理

在围绕Hadoop形成的大数据技术生态当中，MapReduce的地位，在早期是处于核心地位的，但是伴随着数据处理实时性需求的不断提升，更多新的计算框架出现，MapReduce的地位受到压制，但是作为Hadoop原始计算框架，还是需要相应程度的了解和掌握的。今天的大数据入门分享，我们来具体讲一讲Map ...

分类：其他好文时间：2021-02-09 12:33:28 阅读次数：0

Impala官网翻译09-安装Impala

安装Impala Impala是一个针对Apache Hadoop的开源分析数据库，可以快速返回查询响应。按照以下步骤，通过从源码构建在集群上设置Impala。下载最新版本。请参阅Impala下载页面以获取最新版本的链接。检查 README.md 文件，以获得指向构建说明的指针。请检查MD5 ...

分类：其他好文时间：2021-02-06 11:41:43 阅读次数：0

Hadoop+HBase+Spark+Hive环境搭建

本文对Hadoop+HBase+Spark+Hive环境搭建方法和步骤进行了详细介绍和说明，记录于此，供各位同学及自己参考研究。 ...

分类：其他好文时间：2021-02-05 10:38:53 阅读次数：0

Spark环境配置

Spark环境配置 spark-env.sh #JAVA_HOME export JAVA_HOME=/export/servers/jdk1.8.0_271 #Spark Master Address #export SPARK_MASTER_HOME=node01 export SPARK_MA ...

分类：其他好文时间：2021-02-04 11:53:09 阅读次数：0

Spark executor中task的数量与最大并发数

每个task处理一个partition，一个文件的大小/128M就是task的数量 Task的最大并发数当task被提交到executor之后，会根据executor可用的cpu核数，决定一个executor中最多同时运行多少个task。默认情况下一个task对应cpu的一个核。如果一个exec ...

分类：其他好文时间：2021-02-02 11:14:58 阅读次数：0

启动YARN并运行MapReduce程序

备注：此处的hadoop版本是3.1.4 一、配置集群 1.1、配置yarn-site.xml  <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle ...

分类：其他好文时间：2021-02-02 10:48:15 阅读次数：0

hive自定义UDF函数

UDF：用户定义（普通）函数，只对单行数值产生作用；UDF只能实现一进一出的操作。UDF函数自定义实现步骤如下：定义UDF函数，如计算两个数之和 package com.starzy.udf; import org.apache.hadoop.hive.ql.exec.UDF; public cl ...

分类：其他好文时间：2021-02-01 12:38:19 阅读次数：0

Hadoop搭建HA遇到的坑

Hadoop搭建HA遇到的坑重要报错信息 Zookeeper日志 Cannot open channel to 2 at election address node03/172.17.0.4:3888 java.net.ConnectException: Connection refused (C ...

分类：其他好文时间：2021-02-01 12:17:43 阅读次数：0

解决spark-submit的There is insufficient memory for the Java Runtime Environment to continue.（老顽固问题） failed; error='Cannot allocate memory' (errno=12)

Q：第一次提交wordcount案例，OK，一切正常。再次提交，出现下述错误。完整错误粘贴如下： 21/01/27 14:55:48 INFO spark.SecurityManager: Changing modify acls groups to: 21/01/27 14:55:48 INFO ...

分类：编程语言时间：2021-01-28 11:56:52 阅读次数：0

spark 从数据库中读取数据

spark 从数据库中读取数据的几种方式，以Mysql 为例创建spark val spark = SparkSession.builer().appName("用户标签").master("local[*]").getOrCreate() val url = "jdbc:mysql://数据库地 ...

分类：数据库时间：2021-01-27 13:56:39 阅读次数：0

共19831条上一页 1 ... 18 19 20 21 22 ... 1984 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)