对于大数据统计工作,在人对结果不能准确校验的时候就容易造成这样一个现象:统计结果是错误的,或者存在较大的误差,但是人可能感知不到,并将这个结果作为它用,造成一定的错误影响。 那么如何确保统计结果的正确呢? 比如,对于同一个统计结果,通过不同的途径进行统计。就类似于一道题 采用不同的解法,如果得到相同 ...
分类:
其他好文 时间:
2018-03-09 16:42:36
阅读次数:
190
先开个标题,以后慢慢填充。 k近邻算法(knn)属于监督学习 一、 三个关键点:1、k的取值,当k值较小时,选取点较少,相当于会有在较小的范围内进行学习预测,学习误差会减小,但是估计误差会增大,因为训练样本中存在噪声,选取过小的区域,噪声干扰的权重会较大,因为影响泛化能力,k减小意味整体模型复杂,容 ...
分类:
其他好文 时间:
2018-03-09 11:13:38
阅读次数:
161
关于精度丢失问题 昨天晚上做到刘汝佳粉书的一道题,源代码如下: 一开始我以为这就是简单的循环,到10就停了,然后却发现循环没有终结,陷入了死循环。 后来仔细思考了一下。发现了其中的缘由: 计算机做加减法的时候用的是二进制作计算。 十进制在转化成二进制的时候,整数部分没有误差,而小数部分却有,因为转化 ...
分类:
其他好文 时间:
2018-03-08 13:58:53
阅读次数:
198
线性回归 训练模型表示通过有标签样本来学习(确定)所有权重和偏差的理想值。在监督式学习中,机器学习算法通过以下方式构建模型:检查多个样本并尝试找出可最大限度地减少损失的模型;这一过程称为经验风险最小化。 均方误差 (MSE) 指的是每个样本的平均平方损失。要计算 MSE,请求出各个样本的所有平方损失 ...
分类:
其他好文 时间:
2018-03-07 00:58:51
阅读次数:
162
1.试述大数据对思维方式的重要影响。 大数据时代最大的转变就是思维方式的3种转变:全样而非抽样、效率而非精确、相关而非因果。大数据思维是一种容错思维、是一种相关思维、是一种智能思维。大数据思维把人们从旧的发展观、价值观中解放出来,复杂技术的涌现和科技进步促使人们开始从大数据思维视角重新审视世界,从而 ...
分类:
其他好文 时间:
2018-03-06 20:19:25
阅读次数:
263
一、前向传播 w 权重 b 偏差 a 输入 一般地,我们可以把前向传播过程表示: 2. 损失函数和代价函数 损失函数主要指的是对于单个样本的损失或误差; 代价函数表示多样本同时输入模型的时候总体的误差——每个样本误差的和然后取平均值。 3. 反向传播 反向传播的基本思想 就是通过计算输出层与期望值之 ...
分类:
其他好文 时间:
2018-03-06 10:52:21
阅读次数:
182
一、最近做了一个关于自动转速测试仪的项目,其中用到了STM32的RTC时钟的功能,然后开始写代码,并且成功的跑了起来,于是将自己的板子放到桌面上让它跑了一个晚上看下误差,结果发现经过一晚上,误差并不是很大,这点说明STM32的时钟系统还是做的非常强大的,但是在我好奇的将板子上的备用电池拆下来想看看还 ...
分类:
其他好文 时间:
2018-03-06 10:18:15
阅读次数:
185
可能你死了都不知道你会怎么死的 这些错误我以前都没注意,然后死了 卡常 模数用const 读入优化 空间 尽量多开一点点,比如用了长度为$n$的数组,空间就开$n+10$ 有位运算特别是$xor$和$or$时把数组开大一倍 精度 如果精度要求特别高,比如绝对误差$\leq{10}^{ 10}$,就要 ...
分类:
其他好文 时间:
2018-03-05 21:39:37
阅读次数:
190
解题思路 一开始看到这个题目会觉得很简单,但如果按照一开始的思路做下去就会发现思维有很多漏洞,同时效率也不会很高,需要注意的问题如下: 1.base是double类型,并且有可能为零,exponent为int类型,并且有可能为负数 2.对于double类型的数判断相等,得考虑误差 3.对于递归的执行 ...
分类:
其他好文 时间:
2018-03-05 18:14:27
阅读次数:
178
作者:JSong,时间:2017.10.21 本文大量引用了 jasonfreak ( http://www.cnblogs.com/jasonfreak ) 的系列文章,在此进行注明和感谢. 广义的偏差(bias)描述的是预测值和真实值之间的差异,方差(variance)描述距的是预测值作为随机变 ...
分类:
其他好文 时间:
2018-03-04 15:59:14
阅读次数:
218