码迷,mamicode.com
首页 >  
搜索关键字:spark broadcast    ( 8013个结果
Spark ML之高级数据源
一.图像数据源 图像数据源用于从目录加载图像文件,它可以通过ImageIO Java库将压缩图像(jpeg,png等)加载为原始图像表示形式。加载的DataFrame具有一StructType列:“ image”,其中包含存储为图像架构的图像数据。该image列的架构为: origin :(Stri ...
分类:其他好文   时间:2020-09-17 17:38:02    阅读次数:52
adb常用操作
adb常用操作 1.连接指定设备 adb -s 127.0.0.1:5555 shell 2.给某个app发送广播 am broadcast -a "send_by_frank_test" am broadcast -a "send_by_frank_test" --es aaa bbb 3.手机a ...
分类:数据库   时间:2020-09-17 15:53:19    阅读次数:36
监控IO性能(iostat,iotop,free,ps,netstat)抓包工具(tcpdump)
监控IO性能iostat命令安装:yuminstall-ysysstatiostat用于输出CPU和磁盘I/O相关的统计信息.详细的io统计信息分析IO瓶颈参数:-x选项:查看详细信息-c选项:查看CPU使用情况-d选项:查看磁盘使用情况重点关注%util(采用周期内用于IO操作的时间比率,即IO队列非空的时间比率,如果%util接近100%,说明产生的I/O请求太多,I/O系统已经满负荷,该磁盘
分类:移动开发   时间:2020-09-11 16:09:46    阅读次数:52
Spring Cloud Flow与Apache Spark集成
SpringCloudFlow与ApacheSpark集成点击左上角,关注:“锅外的大佬”专注分享国外最新技术内容帮助每位开发者更优秀地成长1.简介SpringCloudDataFlow是用于构建数据集成和实时数据处理管道的工具包。在这种情况下,管道(Pipelines)是使用SpringCloudStream或SpringCloudTask框架构建的SpringBoot应用程序。在本教程中,我们
分类:编程语言   时间:2020-09-07 19:17:49    阅读次数:55
spark源码分析, 任务提交及序列化
org.apache.spark.scheduler.DAGScheduler#submitMissingTasks => org.apache.spark.scheduler.TaskSchedulerImpl#submitTasks // First figure out the indexes ...
分类:其他好文   时间:2020-08-28 14:42:00    阅读次数:47
A machine learning system on spark
简介 https://github.com/fanqingsong/machine_learning_system_on_spark a simple machine learning system demo, for ML study. Based on machine_learning_syst ...
分类:系统相关   时间:2020-08-27 11:48:09    阅读次数:63
10个优秀的数据挖掘工具,一定不要错过
在机器学习的流程中数据挖掘是重要的一环。数据挖掘是从大量数据中提取隐藏的或未知,但可能有用信息的过程。今天给大家介绍10个最强的数据挖掘工具,欢迎小伙伴们收藏起来。1.KNIMEKNIME可以完成常规的数据分析,进行数据挖掘,常见的数据挖掘算法,如回归、分类、聚类等等都有。而且它引入很多大数据组件,如Hive,Spark等等。它还通过模块化的数据流水线概念,集成了机器学习和数据挖掘的各种组件,能够
分类:其他好文   时间:2020-08-24 16:32:14    阅读次数:59
知识汇总之大数据(1)
1.mapReduce 的shuffle 过程 : https://www.iteye.com/blog/langyu-992916 2.spark streaming : https://www.jianshu.com/p/0691204282ab CAS的理解? https://www.jian ...
分类:其他好文   时间:2020-08-13 12:10:50    阅读次数:53
CDH开启kerberos后在第三方机器上部署Spark程序问题解决
一、概述 当CDH平台开启kerberos后,需要kdc服务验证通过和kerberos协议验证通过才可以。如果将spark程序部署在CDH 机器上,直接在生成keytab并使用principal登录kerberos即可。 如果当spark应用程序部署在第三方机器上时,还需要处理krb5.conf注册 ...
分类:其他好文   时间:2020-08-13 12:07:11    阅读次数:88
Spark-RDD-基本介绍
1.定义 RDD是只读的记录分区的集合,是一种基于工作集的应用抽象 创建RDD的方式有两种: 从驱动程序中的集合中并行创建 从外部数据集创建 2.底层存储原理 每个RDD的数据以Block的形式存储在多个机器上,对于每个Executor都会启动一个BlockManagerSlave,并且管理一部分B ...
分类:其他好文   时间:2020-08-08 00:33:32    阅读次数:73
8013条   上一页 1 ... 17 18 19 20 21 ... 802 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!