小提琴图violinplot 小提琴图为箱线图的一个变种,它将分布的核密度估计曲线与箱线图结合在一起。最外围的形状展示了该位置的密度,这样就可以知道数据在哪里分布密度高,哪里分布密度低。中间白点表示中位数,黑色粗条(黑箱)表示四分位数范围(25%分位数和75%分位数),从其延伸的幼细黑线代表 95% ...
分类:
其他好文 时间:
2018-08-24 01:59:48
阅读次数:
192
箱线图boxplot——展示数据的分布 图表作用: 1.反映一组数据的分布特征,如:分布是否对称,是否存在离群点 2.对多组数据的分布特征进行比较 3.如果只有一个定量变量,很少用箱线图去看数据的分布,而是用直方图去观察。一般都要跟其余的定性变量做分组箱线图,可以起对比作用。(key) 适合数据类型 ...
分类:
其他好文 时间:
2018-08-23 22:06:41
阅读次数:
2450
一、3σ原则 3σ原则又称为拉依达准则,该准则具体来说,就是先假设一组检测数据只含有随机误差,对原始数据进行计算处理得到标准差,然后按一定的概率确定一个区间,认为误差超过这个区间的就属于异常值。 正态分布状况下,数值分布表: 注:在正态分布中σ代表标准差,μ代表均值,x=μ为图形的对称轴 二、箱线图 ...
分类:
其他好文 时间:
2018-07-28 12:06:53
阅读次数:
542
Matplotlib绘图一般用于数据可视化 1.常用的图表有: 折线图(坐标系图) 散点图/气泡图 条形图/柱状图 饼图 直方图 箱线图 热力图 折线图(坐标系图) 折线图用于显示随时间或有序类别的变化趋势 线条和标记节点样式 标记字符:标记线条中的点 线条颜色,color='g' 线条风格,lin ...
分类:
其他好文 时间:
2018-07-07 01:09:55
阅读次数:
221
分布图 PCA图 画PCA,还是推荐scater,速度很快,一般的R包真是慢到你难以想象。 Scatterplot with marginal boxplots 在散点图的侧边画箱线图,可以在一张图上提供最多的信息。教程1,教程2. 教程 ...
分类:
其他好文 时间:
2018-05-16 15:24:39
阅读次数:
157
数据质量分析 脏数据包括:缺失值;异常值;不一致的值;重复数据及含有特殊符号的数据; 1.缺失值处理 统计缺失率,缺失数 2.异常值处理 (1)简单统计量分析 (2)3Q原则 正态分布情况下,小概率事件为异常值 不服从正太分布的,可以用原离平均值多少倍标准差来分析 (3)箱线图分析 使用descri ...
分类:
编程语言 时间:
2018-04-19 15:02:38
阅读次数:
171
使用ggplot2绘制箱线图 绘制箱线图代码 data1$学区房 ...
分类:
编程语言 时间:
2018-01-16 18:39:16
阅读次数:
547
3.1 使用图形detach(mydata) #链接数据框plot(S3,S4) abline(lm(S3~S4)) #添加最优拟合曲线title("heheh,fuck you") detach(mydata) #关闭链接数据框 mydata 保存文件为pdf在程序前后加上两句pdf("c:\\u ...
分类:
其他好文 时间:
2017-12-05 13:28:08
阅读次数:
203
dev.new()新建画板 plot()绘制点线图,条形图,散点图. barplot( ) 绘制条形图 dotchart( ) 绘制点图 pie( )绘制饼图. pair( )绘制散点图阵 boxplot( )绘制箱线图 hist( )绘制直方图 scatterplot3D( )绘制3D散点图. 低 ...
分类:
其他好文 时间:
2017-11-13 13:43:38
阅读次数:
189
由图可以看出,在6名运动员中,平均成绩最高的是克里斯蒂安·赖茨(中位数为10.20),最低的是基思·桑德森(中位数为9.80);从射击成绩的分布来看,列昂尼德·叶基莫夫的成绩比较集中(没有离群点),而罗曼·邦达鲁克的成绩最为分散(箱子较长)。从分布形状来看,射击成绩分布多数为左偏分布。这是因为射击成 ...
分类:
其他好文 时间:
2017-10-30 14:18:38
阅读次数:
268