在数据分析挖掘过程中常用的聚类算法有1.K-Means聚类,2.K-中心点,3.系统聚类. 1.K-均值聚类在最小误差基础上将数据划分为预定的类数K(采用距离作为相似性的评价指标).每次都要遍历数据,所以大数据速度慢 2.k-中心点,不采用K-means中的平均值作为簇中心点,而是选中距离平均值最近 ...
分类:
编程语言 时间:
2018-05-13 16:07:57
阅读次数:
556
求解非线性优化问题的有效手段 牛顿法:优点:收敛速度快 缺点:定步长迭代,有时会使函数值上升。计算量大,要求函数必须有连续的一、二阶偏导数,海森矩阵必须正定 拟牛顿法:在牛顿法的基础上加入了寻求最优步长因子 示例代码:求解目标函数的局部最小值 主函数: 目标函数: 运行结果: ...
分类:
其他好文 时间:
2018-05-13 13:49:49
阅读次数:
142
取至:机器学习算法原理与编程实践(郑捷) # -*- coding: utf-8 -*-# Filename : matrix05.pyimport operatorfrom numpy import * eps = 1.0e-6 # 误差量 # 矩阵的特征值和特征向量A = mat([[8,1,6 ...
分类:
其他好文 时间:
2018-05-12 02:46:54
阅读次数:
130
卷积神经网络的训练过程 卷积神经网络的训练过程分为两个阶段。第一个阶段是数据由低层次向高层次传播的阶段,即前向传播阶段。另外一个阶段是,当前向传播得出的结果与预期不相符时,将误差从高层次向底层次进行传播训练的阶段,即反向传播阶段。训练过程如图4-1所示。训练过程为: 1、网络进行权值的初始化; 2、 ...
分类:
其他好文 时间:
2018-05-09 15:01:44
阅读次数:
27061
后向传播指的是在训练的时候,根据最终输出的误差来调整倒数第二层、倒数第三层……第一层的参数的过程。 输出层权值调整: 隐藏层权值调整: 偏置的调整: 后向传播算法步骤 ...
分类:
编程语言 时间:
2018-05-08 19:15:26
阅读次数:
150
一、介绍 AlexNet最后2个全连接层中使用了Dropout,因为全连接层容易过拟合,而卷积层不容易过拟合。 1.随机删除网络中的一些隐藏神经元,保持输入输出神经元不变; 2.将输入通过修改后的网络进行前向传播,然后将误差通过修改后的网络进行反向传播; 3.对于另外一批的训练样本,重复上述操作1 ...
分类:
Web程序 时间:
2018-05-05 14:20:32
阅读次数:
1372
线性回归时若数据不服从正态分布,会给线性回归的最小二乘估计系数的结果带来误差,所以需要对数据进行结构化转换。 常用数据转换方式为: P值比较 普通数据转化的局限性 对比Box-Cox变换公式和普通数据变换公式,发现Box-Cox只是在形式上又一定的改进。 确定λ的值 ...
分类:
其他好文 时间:
2018-05-05 11:15:45
阅读次数:
231
原题戳这里 开始一小段时间的POJ计算几何练习计划(估计很快就会被恶心回去) 题解 用一条平行于y轴的扫描线,计算两条扫描线之间多少格子被覆盖了 精度可tm变态了,可能是因为题目要求的关系吧,需要上取整和下取整,可能有一点误差也给算进去了,精度掉的很大 看一下上一次的上边界是哪里,不要重复计算 代码 ...
分类:
其他好文 时间:
2018-05-05 11:15:24
阅读次数:
145
1、NaN是一个特殊的数值,表示非数。 NaN不会与任何数值变量相等,即NaN == NaN 也返回false. 2、浮点数计算会产生一个误差。判断两个浮点数是否相等,通过判断两个浮点数的差值。只要差值小于一个足够小的数即可认为相等。 ...
分类:
其他好文 时间:
2018-05-05 11:11:25
阅读次数:
125