最近学习python数据分析,遇到了四分位数计算问题,因四分位数计算公式不一致,导致结果不一样,坑爹的百度只给了一种计算方法,容易迷惑初学者,故总结如下: 计算方法三个四分位数的确定:先按从小到大方法排序,然后使用下列方法。方法1:n+1法 Q1的位置= (n+1) × 0.25 Q2的位置= (n ...
分类:
其他好文 时间:
2020-02-23 20:35:47
阅读次数:
729
前三章读后感 通过阅读《构造之法》,使我了解了一些基本的软件问题。 第一、首先什么软件是如何开发的? 软件是软件的程序和技术,程序由数据结构和算法组成,通过一行行的代码,使其计算方法建立在数据结构上。但这还不完全能够构成一个软件。软件构建的过程,正如书中所言,它适用于每个软件。一个复杂的软件需要良好 ...
分类:
其他好文 时间:
2020-02-23 09:20:08
阅读次数:
74
1、 均值 数学定义: MATLAB中均值、方差、均方差的计算方法 Matlab函数:mean x=[1 2 3]; mean(x) ans = 2 如果X是一个矩阵,则其均值是一个向量组。mean(X,1)为列向量的均值,mean(X,2)为行向量的均值。 x=[1 2 3;4 5 6]; mea ...
分类:
其他好文 时间:
2020-02-22 09:48:43
阅读次数:
77
题目如下: text.txt的内容: 知识点:python怎么做进制转换 除了自己按照计算方法写一遍进制转换,可以用python自带的强制转换: int(a,num) 其中,int是转换成十进制整数类型,a是待转换数字,num是a的进制,默认是10进制,在本题中可以写2,8,16 然后用格式化输出: ...
分类:
编程语言 时间:
2020-02-18 14:37:02
阅读次数:
91
每秒查询率QPS是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准,在因特网上,作为域名系统服务器的机器的性能经常用每秒查询率来衡量。原理:每天80%的访问集中在20%的时间里,这20%时间叫做峰值时间 公式:( 总PV数 * 80% ) / ( 每天秒数 * 20% ) = 峰值时间每秒 ...
分类:
Web程序 时间:
2020-02-17 16:04:17
阅读次数:
240
进入星际平面,面对最严厉的数学家。 简介 你已经把你的道路变成了一个神秘的现实交替的层面。虽然有最聪明的巫师住在这里,但你一定可以找到他们的秘密宝藏。 这些狡猾的巫师编织复杂的咒语,不会让冒险家轻易闯入。使用括号来确定公式的正确顺序! 仔细听每个巫师说的,分析出每个魔法数的计算方法。你需要依次对付一 ...
分类:
其他好文 时间:
2020-02-14 11:16:03
阅读次数:
103
看到网上有一堆“博客”,明显是抄袭的,前后矛盾,自己摸索着写了一个PCA的计算过程。 假设有5个学生的6门功课:语文、数学、地理、化学、英语、历史,成绩如下: 注意,行是样本(表示一个学生),列是特征(表示一门课)。 首先要搞明白什么是协方差。定义:(下面的n是样本数) 均值(假设权重概率都为1): ...
分类:
其他好文 时间:
2020-02-13 11:24:54
阅读次数:
147
1. 数据科学领域中常用的python库 Numpy库:数据运算的基础库,运行效率高(底层C语言,高效index) Scipy库:实现了常用的科学计算方法(线性代数,傅里叶变换,信号和图像处理) Pandas库:分析数据的利器,高级数据结构(Series,DataFrame) Matplotlib库 ...
分类:
编程语言 时间:
2020-02-12 19:04:47
阅读次数:
101
1 背景 + 科学研究中,常常先统计某种度量指标的度量值,然后给出某些计算方法,开展计算,最终得到所需的计算值。 + 在程序错误定位和缺陷预测领域,有类似的一种做法:首先,先给出某些度量指标,并给出这样一些假设前提,即,正确语句和错误语句在这些基本度量指标上,存在统计差异性。进而统计(源)程序在些指 ...
分类:
其他好文 时间:
2020-02-12 10:41:50
阅读次数:
58
Linear regression 1. 线性回归 线性回归模型尽量写成矩阵形式进行计算。 为什么矩阵计算比循环快很多? 【知乎】因为通常的数学库,矩阵运算都是用BLAS、ATLAS之类的库。这些库中,矩阵运算都是优化过的(也就是说通常不会用两层循环来计算矩阵乘法,具体的计算方法请参考源代码)。 当 ...
分类:
其他好文 时间:
2020-02-04 13:44:43
阅读次数:
102