码迷,mamicode.com
首页 >  
搜索关键字:中位数    ( 1114个结果
用R处理一组数据的三种方式
USArrests是R附带的一个数据集,现在我们需要创建一个factor向量urbancat,如果UrbanPop列的某个值在中位数之上,就把urbancat对应位置的值设为1,否则设为0。 这种数据处理任务实在太简单了,一个for循环就能搞定。首先,我们计算一下UrbanPop的中位数: 然后,用 ...
分类:其他好文   时间:2018-06-25 01:11:02    阅读次数:798
十道海量数据处理面试题与十个方法大总结
1. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 方案1:可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。 s 遍历文件a,对每个url求取, ...
分类:其他好文   时间:2018-06-24 00:55:37    阅读次数:171
描述性统计的matlab实现
理论讲的再多不会做也白弄 直接上手 一.针对接近正态分布的(均值,方差,标准差,极差,变异系数,偏度,峰度) 这里我必须提前说明一点就是,你在写好函数后,函数的名是dts,你保存的文件名也必须是dts.m才行,这样调用dts()函数的时候才不会出现错。 二.针对 有极端值(中位数,上下四分位数,四分 ...
分类:其他好文   时间:2018-06-20 18:34:49    阅读次数:235
求指定整数数组的中位数
//int a[]={12,43,56,14,78,16,50,26,30,40};的中位数//按数据从小到大排序,如果是奇数个数字,则中间那个数字为中位数;如果是偶数个数字,则中间2个数字的平均值为中位数。 int getSortedArr(int * a,int len){ int i,j,te ...
分类:编程语言   时间:2018-06-17 13:30:29    阅读次数:182
[leetcode]295. Find Median from Data Stream数据流的中位数
Median is the middle value in an ordered integer list. If the size of the list is even, there is no middle value. So the median is the mean of the two ...
分类:其他好文   时间:2018-06-16 10:27:48    阅读次数:181
bzoj1303[CQOI2008]中位数图 / 乱搞
题目描述 给出1~n的一个排列,统计该排列有多少个长度为奇数的连续子序列的中位数是b。中位数是指把所有元素从小到大排列后,位于中间的数。 输入输出格式 输入格式: 第一行为两个正整数n和b,第二行为1~n的排列。 【数据规模】 对于30%的数据中,满足n≤100; 对于60%的数据中,满足n≤100 ...
分类:其他好文   时间:2018-06-14 14:45:57    阅读次数:173
题解:中位数
传送门 首先考虑的是二叉搜索树,每次查找当前排名(i+1)/2的数。但是对于某些数据,其递归层数过多,会导致爆栈。 那么显然可以用Treap或Splay。 这里考虑线段树: 由于线段树是一种平衡树,所以一定保证能跑出来。 对于线段树,我们基于二叉搜索树的查找方法并介于线段树平衡的性质求解。 对于线段 ...
分类:其他好文   时间:2018-06-14 11:17:45    阅读次数:176
数据挖掘-概念与技术1
1. 数据 1 数据对象与属性类型 属性 1. 标称属性 2. 二元属性(布尔属性) 3. 序数属性 4. 数值属性 1. 区间标度属性 2. 比率标度属性 5. 离散属性与连续属性 2. 数据的基本统计描述 1. 中心趋势度量:均值、中位数和众数 2. 度量数据分布:极差、四分位数、方差、标准差和 ...
分类:其他好文   时间:2018-06-12 10:23:50    阅读次数:175
pandas基础命令速查表
pandas基础命令速查表 数据的导入 数据的导出 创建测试对象 数据的查看与检查 数据的选取 数据的清洗 数据的过滤(filter)排序(sort)和分组(group) 数据的连接(join)与组合(combine) 一、数据的导入 pd.read_csv(filename) 导入csv格式文件中 ...
分类:其他好文   时间:2018-06-10 20:14:45    阅读次数:226
箱型图
箱型图是在1977年由美国的统计学家约翰·图基(John Tukey)发明的。它由五个数值点组成:最小值(min),下四分位数(Q1),中位数(median),上四分位数(Q3),最大值(max)。也可 以往盒图里面加入平均值(mean)。如上图。下四分位数、中位数、上四分位数组成一个“带有隔间的盒 ...
分类:其他好文   时间:2018-06-01 14:29:01    阅读次数:334
1114条   上一页 1 ... 45 46 47 48 49 ... 112 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!