特征工程 一、特征处理 1. 正负样本不均衡问题 a) Oversampleing b) 修改损失函数 c) 取n份正样本 与 负样本 分别构建分类器,然后vote 2. 数值特征处理 a) 归一化 b) Log变换 c) 统计max min mean std d) 离散化 e) HASH分桶 f) ...
分类:
其他好文 时间:
2016-12-11 12:24:54
阅读次数:
343
这几天看了看PCA及其人脸识别的流程,并在网络上搜相应的python代码,有,但代码质量不好,于是自己就重新写了下,对于att_faces数据集的识别率能达到92.5%~98.0%(40种类型,每种随机选5张训练,5张识别),全部代码如下,不到50行哦。 ...
分类:
编程语言 时间:
2016-12-09 19:42:31
阅读次数:
821
ACE算法源自retinex算法,可以调整图像的对比度,实现人眼色彩恒常性和亮度恒常性,通过差分来计算目标点与周围像素点的相对明暗关系来校正最终像素值,有很好的增强效果。但是计算复杂度非常高,本文提出一种有效的快速实现方法。 为叙述方便,这里假设后面的图像都是归一化到[0,1]之间的浮点数图像。 A ...
分类:
编程语言 时间:
2016-12-05 22:33:33
阅读次数:
477
计算频数: 给定一个序列t: hist = {} for x in t: hist[x] = hist.get(x,0)+1 得到的结果是一个将值映射到其频数的字典。将其除以n即可把频数转换成频率,这称为归一化: n = float(len(t)) pmf = {} for x, freq in h ...
分类:
编程语言 时间:
2016-12-04 00:21:34
阅读次数:
472
原理: (1) 输入点A,输入已知分类的数据集data (2) 求A与数据集中每个点的距离,归一化,并排序,选择距离最近的前K个点 (3) K个点进行投票,票数最多的分类即为所求 优点: 简单,可用于非线性分类 缺点: 当样本不均衡时影响投票结果; 分类结果受K值影响; 时空复杂度高:需要保存全部数 ...
分类:
编程语言 时间:
2016-12-03 21:12:34
阅读次数:
208
很多人都认为retinex和暗通道去雾是八杆子都打不着的增强算法。的确,二者的理论、计算方法都完全迥异,本人直接从二者的公式入手来简单说明一下,有些部分全凭臆想,不对之处大家一起讨论。 首先,为描述方便,后面所有的图像都是归一化到[0,1]的浮点数图像。 Retinex的公式就是: J=I/L (1 ...
分类:
其他好文 时间:
2016-12-03 15:39:58
阅读次数:
305
图像增强方面我共研究了Retinex、暗通道去雾、ACE等算法。其实,它们都是共通的。甚至可以说,Retinex和暗通道去雾就是同一个算法的两个不同视角,而ACE算法又是将Retinex和灰度世界等白平衡理论相结合的产物。下面将依次讨论,每个算法写一个心得,欢迎拍砖。 今天先写Retinex。Ret ...
分类:
编程语言 时间:
2016-12-02 21:52:33
阅读次数:
224
笔者将和大家分享一个结合了TensorFlow和最近发布的slim库的小应用,来实现图像分类、图像标注以及图像分割的任务,围绕着slim展开,包括其理论知识和应用场景。 之前自己尝试过许多其它的库,比如Caffe、Matconvnet、Theano和Torch等。它们各有优劣,而我想要一个可靠灵活的 ...
分类:
其他好文 时间:
2016-11-29 06:32:38
阅读次数:
2511
http://codeforces.com/problemset/problem/735/C 题意。。采用淘汰赛制。。只要打输就退出比赛。。而且只有两个选手打过的场数 相差不超过1才能比赛。。最后问你。。最多打几场比赛能决出冠军 那么这个题的做法是。。画图。。观察。。分析 Tip:首先我们观察未知量 ...
分类:
其他好文 时间:
2016-11-28 23:27:31
阅读次数:
207
glsl 的reflect(I,N)其中I是 顶点位置到眼睛的方向向量,N为顶点法线,必须要归一化 橙宝书里给出的计算过程是这样的:reflect(I,N) = I - 2 *dot(I,N)*N // 暂且记下,回去再写 ...
分类:
其他好文 时间:
2016-11-25 11:58:36
阅读次数:
150