import com.hankcs.hanlp.HanLPimport org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf, SparkContext}import scala.collection.immutable.StringO ...
分类:
其他好文 时间:
2021-07-02 16:33:14
阅读次数:
0
import org.apache.spark.SparkConfimport org.apache.spark.streaming.{Seconds, StreamingContext}// 创建一个本地模式的StreamingContext, 两个工作线程, 1s的批处理间隔//Master要求 ...
分类:
其他好文 时间:
2021-07-02 16:32:11
阅读次数:
0
简介:Quick BI是专为云上用户量身打造的智能数据分析和可视化BI产品,帮助企业快速完成从传统的数据分析到数据云化+分析云化的转变,将企业的业务数据产出后以最快的速度被推送到各组织侧消费使用。本篇着重介绍Quick BI在可视化分析上的能力与演进之路。Quick BI是专为云上用户量身打造的智能 ...
分类:
其他好文 时间:
2021-07-02 16:31:55
阅读次数:
0
ndarray的内存结构 和其他的库一样,每个库都可能有自己独特的数据结构,例如OpenCV,numpy库的多维数组叫做ndarray( N dimensionality array ),它的内存结构如下图: ndarray的内存结构 在这个结构体中有两个对象,一个是用来描述元素类型的头部区域,一个 ...
分类:
编程语言 时间:
2021-07-02 15:41:43
阅读次数:
0
即消费者行为模型。原来一直倡导的AIDMA模式,即——引起消费者注意——产生兴趣——激发欲望——强化记忆——促使行动。现在随着互联网的兴起,消费者在商品的选择上已不限于实体,更多的是电商的形式。甚至商品也不一定是实体的,也有虚拟的、知识类的产品。因此从过去的AIDMA模式做进一步的延伸,慢慢演变出A ...
分类:
其他好文 时间:
2021-07-02 15:41:24
阅读次数:
0
1、pandas数据结构之DataFrame DataFrame生成方式:1、从另一个DataFrame创建。2、从具有二维形状的NumPy数组或数组的复合结构生成。3、使用Series创建。4、从CSV之类文件生成。下面介绍DataFrame的简单用法: a):读取文件 代码: from pand ...
分类:
编程语言 时间:
2021-07-02 15:40:00
阅读次数:
0
# Python数据分析:pandas数据操作和分析案例 ###### 项目介绍: * [ https://www.kaggle.com/openfoodfacts/world-food-facts ](https://www.kaggle.com/openfoodfacts/world-food- ...
分类:
编程语言 时间:
2021-07-02 15:39:04
阅读次数:
0
好久没发博客了,今天来发一篇分析股价相关度的。╮ ( ╯ ▽ ╰ ) ╭ 为什么要分析股价相关度呢,我们来引入一个概念——配对交易 所谓的配对交易,是基于统计套利的配对交易策略是一种市场中性策略,具体的说,是指从市场上找出历史股价走势相近的股票进行配对,当配对的股票价格差偏离历史均值时,则做空股价较 ...
分类:
编程语言 时间:
2021-07-02 15:37:28
阅读次数:
0
假设检验分为参数假设检验和分布拟合假设检验和非参数检验 一、假设检验的思想: 建立假设 选择检验统计量并给出拒绝域形式 选择显著性水平 给出拒绝域 做出判断 二、p 值:利用样本观测值能够作出拒绝原假设的最小显著性水平 三、参数假设检验类型:详见茆诗松 正态总体参数假设检验 指数参数假设检验,对指数 ...
分类:
其他好文 时间:
2021-07-02 15:37:13
阅读次数:
0
【推荐系统算法实战】 基于网页的 Notebook:Zeppelin 交互式数据分析 如果有一个工具,可以让你在同一个Web页面上写Shell代码,Python代码,Scala代码,你想要么? 如果还可以执行PySpark代码和Spark代码呢?心动了吗? 如果还可以写Hive-SQL,Spark- ...
分类:
编程语言 时间:
2021-07-02 15:35:46
阅读次数:
0