码迷,mamicode.com
首页 >  
搜索关键字:spark 博客地址    ( 8326个结果
Spark ML 之 ALS内存溢出的解决办法
原帖:https://blog.csdn.net/Damonhaus/article/details/76572971 问题:协同过滤 ALS算法。在测试过程中遇到了内存溢出的错误 解决办法1:降低迭代次数,20次 -> 10次 val model = new ALS().setRank(10).s ...
分类:其他好文   时间:2020-10-24 09:45:55    阅读次数:24
linux系统层面调优和常见的面试题
无论对Spark集群,还是Hadoop集群等大数据相关的集群进行调优,对linux系统层面的调优都是必不可少的,这里主要介绍3种常用的调优和linux常见面试题 ...
分类:系统相关   时间:2020-10-20 16:23:11    阅读次数:36
Spark ML 特征处理类之 VectorAssembler 向量装配转换器/VectorIndexer
一、VectorAssembler package com.home.spark.ml import org.apache.spark.SparkConf import org.apache.spark.ml.feature.VectorAssembler import org.apache.spa ...
分类:其他好文   时间:2020-10-18 09:57:35    阅读次数:15
2020 秋招 阿里巴巴大数据面试 带答案!
猫场面试题第 1 套 以下为我为大家整理的猫场面试题第一套,均为笔者自己参加面试或者一些读者分享给我的题目,保证真实和准确性。 1 框架部分 1.1 Spark 提交 job 流程 所谓提交流程,其实就是我们开发人员根据需求写的应用程序通过 Spark 客户端提交给 Spark 运行环境执行计算的流 ...
分类:其他好文   时间:2020-10-13 17:19:39    阅读次数:26
算法基础
算法基础 数据分析 数学基础 在进行算法建模时,深入了解数据情况,做各类探索性分析,统计建模等工作非常重要,这方面对一些数学基础知识有一定的要求,例如概率论,统计学等。这方面除了经典的数学教材,也可以参考更程序员向的《统计思维》,《贝叶斯方法》,《程序员的数学2》等书籍。 自我考核:理解实际项目中的 ...
分类:编程语言   时间:2020-10-10 17:55:27    阅读次数:24
spark之 连接SQL和HIVE
一、连接SQL package com.njbdqn.linkSql import java.util.Properties import org.apache.spark.sql.SparkSession import org.apache.spark.sql._ object LinkSql { ...
分类:数据库   时间:2020-10-06 20:52:59    阅读次数:35
SparkStreaming+Kafka
Receiver Direct offset注意点 ...
分类:其他好文   时间:2020-10-06 20:46:36    阅读次数:26
PySpark基于Python的Spark企业级大数据分析,以实际数据分析为驱动讲解
PySpark基于Python的Spark企业级大数据分析,以实际数据分析为驱动讲解 ...
分类:编程语言   时间:2020-09-18 00:55:02    阅读次数:44
Spark的Shuffle和MR的Shuffle异同
介绍 不论MapReduce还是RDD,shuffle都是非常重要的一环,也是影响整个程序执行效率的主要环节,但是在这两个编程模型里面shuffle却有很大的异同。 shuffle的目的是对数据进行混洗,将各个节点的同一类数据汇集到某一个节点进行计算,为了就是分布式计算的可扩展性。 可能大家多MR的 ...
分类:其他好文   时间:2020-09-17 19:31:45    阅读次数:30
Spark ML之高级数据源
一.图像数据源 图像数据源用于从目录加载图像文件,它可以通过ImageIO Java库将压缩图像(jpeg,png等)加载为原始图像表示形式。加载的DataFrame具有一StructType列:“ image”,其中包含存储为图像架构的图像数据。该image列的架构为: origin :(Stri ...
分类:其他好文   时间:2020-09-17 17:38:02    阅读次数:52
8326条   上一页 1 ... 17 18 19 20 21 ... 833 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!