# -*- coding: utf-8 -*-# @Time : 2021/1/25 22:01# @Author : Mr.Heiimport xlsxwriterworkbook=xlsxwriter.Workbook('chart.xlsx')worksheet=workbook.add_wo ...
分类:
其他好文 时间:
2021-01-28 12:08:52
阅读次数:
0
https://www.cnblogs.com/mr-wuxiansheng/p/6974170.html ...
分类:
其他好文 时间:
2021-01-19 11:57:04
阅读次数:
0
协方差矩阵 https://blog.csdn.net/Mr_HHH/article/details/78490576 分清数据的维度m-1还是n-1根据所选的数据维度走 上例子中按列求均值 ...
分类:
其他好文 时间:
2021-01-18 11:04:20
阅读次数:
0
1. 设置执行引擎 set hive.execution.engine=mr;set hive.execution.engine=spark; 如果设置执行引擎为MR,那么调用Hadoop的maprecude来运行需要执行的job的程序; 如果设置执行引擎为spark,那么就会调用spark来执行任 ...
分类:
其他好文 时间:
2021-01-15 12:15:21
阅读次数:
0
以下为复制内容: https://blog.csdn.net/mr__l1u/article/details/81772073 1> 进程、线程和协程的认识: 进程是系统进行资源分配和调度的独立单位; 线程是进程的实体,是CPU调度和分派的基本单位; 协程也是线程,称微线程,自带CPU上下文,是比线 ...
分类:
编程语言 时间:
2020-12-29 11:03:46
阅读次数:
0
(一)RDD、DataFream、DataSet 理解 1. RDD理解 (1) RDD定义为弹性分布式数据集合。 MR运算之间数据共享差: MR的计算之间的数据共享只能通过将数据写入外部存储系统。后一步计算需要从外部存储系统中加载进来的方式进行。 Spark 思路相反,设计了一种抽象-RDD(弹性 ...
分类:
其他好文 时间:
2020-11-10 10:31:29
阅读次数:
3
Reporting and analytics with Power BI home page This topic points you to resources that you can use to learn more about the business intelligence (BI) ...
分类:
其他好文 时间:
2020-11-01 09:20:29
阅读次数:
20
java爬虫系列(二)——爬取动态网页 Mr_OOO 2018-01-01 15:59:40 11440 收藏 11 分类专栏: 爬虫 入门专栏 最简单的java爬虫 文章标签: java 爬虫 seimiagent seimicrawler动态网页 版权 准备工作 项目地址 网页解析工具地址 启动 ...
分类:
编程语言 时间:
2020-10-22 22:20:24
阅读次数:
19
问题 A: Fast Forwarding 时间限制: 1 Sec 内存限制: 128 MB提交 状态 题目描述 Mr. Anderson frequently rents video tapes of his favorite classic films. Watching the films s ...
分类:
其他好文 时间:
2020-09-17 23:48:52
阅读次数:
48
介绍 不论MapReduce还是RDD,shuffle都是非常重要的一环,也是影响整个程序执行效率的主要环节,但是在这两个编程模型里面shuffle却有很大的异同。 shuffle的目的是对数据进行混洗,将各个节点的同一类数据汇集到某一个节点进行计算,为了就是分布式计算的可扩展性。 可能大家多MR的 ...
分类:
其他好文 时间:
2020-09-17 19:31:45
阅读次数:
30