import org.apache.spark.SparkConfimport org.apache.spark.streaming.{Seconds, StreamingContext}// 创建一个本地模式的StreamingContext, 两个工作线程, 1s的批处理间隔//Master要求 ...
分类:
其他好文 时间:
2021-07-02 16:32:11
阅读次数:
0
![](https://img2020.cnblogs.com/blog/1942163/202107/1942163-20210702123346207-59803968.png) ![](https://img2020.cnblogs.com/blog/1942163/202107/194216... ...
分类:
其他好文 时间:
2021-07-02 16:26:17
阅读次数:
0
好久没发博客了,今天来发一篇分析股价相关度的。╮ ( ╯ ▽ ╰ ) ╭ 为什么要分析股价相关度呢,我们来引入一个概念——配对交易 所谓的配对交易,是基于统计套利的配对交易策略是一种市场中性策略,具体的说,是指从市场上找出历史股价走势相近的股票进行配对,当配对的股票价格差偏离历史均值时,则做空股价较 ...
分类:
编程语言 时间:
2021-07-02 15:37:28
阅读次数:
0
假设检验分为参数假设检验和分布拟合假设检验和非参数检验 一、假设检验的思想: 建立假设 选择检验统计量并给出拒绝域形式 选择显著性水平 给出拒绝域 做出判断 二、p 值:利用样本观测值能够作出拒绝原假设的最小显著性水平 三、参数假设检验类型:详见茆诗松 正态总体参数假设检验 指数参数假设检验,对指数 ...
分类:
其他好文 时间:
2021-07-02 15:37:13
阅读次数:
0
【推荐系统算法实战】 基于网页的 Notebook:Zeppelin 交互式数据分析 如果有一个工具,可以让你在同一个Web页面上写Shell代码,Python代码,Scala代码,你想要么? 如果还可以执行PySpark代码和Spark代码呢?心动了吗? 如果还可以写Hive-SQL,Spark- ...
分类:
编程语言 时间:
2021-07-02 15:35:46
阅读次数:
0
情景介绍: python连接sqlserver2019 附加数据库 按照网上的各种修改,都不管用 连接字符串: sqlserver2019的数据库 修改:加上前缀 ...
分类:
数据库 时间:
2021-07-01 17:26:53
阅读次数:
0
一、线性回归 1.定义 线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y = w’x+e,e为误差服从均值为0的正态分布。 回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线 ...
分类:
其他好文 时间:
2021-06-30 18:32:28
阅读次数:
0
通常sort和uniq一起使用,sort在前,uniq在后。 uniq -c是把个数统计在一行的最前面;uniq -u是去重但不打印重复个数。 但uniq的去重是相邻且相同的缩为一个 # cat data1 1 2 2 2 2 3 3 1 1 1 # cat data1 |uniq -c 1 1 4 ...
分类:
其他好文 时间:
2021-06-30 18:17:48
阅读次数:
0
本方案基于C/S三层架构、SQLServer数据数据库,可监测所有带数据采集的水电气表运行信息,形成水电气的分类、分项、分区域统计分析,对能源的统一调度、优化能源介质平衡、提高环保质量、降低企业综合能耗和提高劳动生产率有重要作用,帮助客户更有效的使用能源,从而实现“节能管理、绿色能效” 系统架构示意 ...
分类:
其他好文 时间:
2021-06-30 17:50:40
阅读次数:
0
根据最近的数据统计,今日的头条新闻总共给用户带来了7亿多条评论。其中,“头条号”平台拥有超过十二万个账号,“头条号”上发布的自媒体内容总量超过8.五万条,与今日头条合作的各类新闻媒体、政府部门、组织等也超过3.五万条。这一数据可以提供足够的信息,说明今日头条广告词具有很大的传播力和知名度。因此也就成 ...
分类:
其他好文 时间:
2021-06-30 17:34:26
阅读次数:
0