码迷,mamicode.com
首页 >  
搜索关键字:spark scala    ( 10387个结果
Hadoop+HBase+Spark+Hive环境搭建
本文对Hadoop+HBase+Spark+Hive环境搭建方法和步骤进行了详细介绍和说明,记录于此,供各位同学及自己参考研究。 ...
分类:其他好文   时间:2021-02-05 10:38:53    阅读次数:0
Spark环境配置
Spark环境配置 spark-env.sh #JAVA_HOME export JAVA_HOME=/export/servers/jdk1.8.0_271 #Spark Master Address #export SPARK_MASTER_HOME=node01 export SPARK_MA ...
分类:其他好文   时间:2021-02-04 11:53:09    阅读次数:0
Scala 随笔
一、声名值和变量 1. val变量 1.1 隐式声明变量 scala> val myStr = "Hello World!" myStr: String = Hello World! 1.2 显式声明变量的类型 scala> val myStr2 : String = "Hello World!" ...
分类:其他好文   时间:2021-02-04 11:40:00    阅读次数:0
几种语言的比较(WIP)
各种feature的实现 执行shell 处理时间 处理参数 处理文件 logging test 多线程、进程,并发 语言 python groovy scala java C++ C shell go 执行shell, check output groovy a= "ls".execute(); ...
分类:编程语言   时间:2021-02-03 10:42:48    阅读次数:0
寒假学习日报(二十三)
今日学习:《机器学习十讲》第六讲,考研择校相关信息处理。 scala学习: package com.chapter01.datatype object TypeDemo02 { def main(args: Array[String]): Unit = { println("Long的最大值:" + ...
分类:其他好文   时间:2021-02-02 11:23:01    阅读次数:0
Spark executor中task的数量与最大并发数
每个task处理一个partition,一个文件的大小/128M就是task的数量 Task的最大并发数 当task被提交到executor之后,会根据executor可用的cpu核数,决定一个executor中最多同时运行多少个task。 默认情况下一个task对应cpu的一个核。如果一个exec ...
分类:其他好文   时间:2021-02-02 11:14:58    阅读次数:0
解决spark-submit的There is insufficient memory for the Java Runtime Environment to continue.(老顽固问题) failed; error='Cannot allocate memory' (errno=12)
Q:第一次提交wordcount案例,OK,一切正常。再次提交,出现下述错误。完整错误粘贴如下: 21/01/27 14:55:48 INFO spark.SecurityManager: Changing modify acls groups to: 21/01/27 14:55:48 INFO ...
分类:编程语言   时间:2021-01-28 11:56:52    阅读次数:0
spark 从数据库中读取数据
spark 从数据库中读取数据的几种方式,以Mysql 为例 创建spark val spark = SparkSession.builer().appName("用户标签").master("local[*]").getOrCreate() val url = "jdbc:mysql://数据库地 ...
分类:数据库   时间:2021-01-27 13:56:39    阅读次数:0
spark-------------RDD 转换算子-----value类型(一)
引言 RDD 根据数据处理方式的不同将算子整体上分为 Value 类型、双 Value 类型和 Key-Value类型,本文主要讲一些Value 类型 正文 资源路径和资源内容 map ###函数签名:def map[U: ClassTag](f: T ? U): RDD[U] ###函数说明:将处 ...
分类:其他好文   时间:2021-01-27 12:50:51    阅读次数:0
Spark实战(三)本地连接远程Spark(Python环境)
一、Python环境准备 远程服务器上Python版本要与本地想匹配,这里本地使用Anaconda来进行安装,远程服务器之间安装。 wget --no-check-certificate https://www.python.org/ftp/python/3.6.7/Python-3.6.7.tgz ...
分类:编程语言   时间:2021-01-25 11:30:39    阅读次数:0
10387条   上一页 1 ... 12 13 14 15 16 ... 1039 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!