① Categories:种类表相应字段:CategoryID :类型ID;CategoryName:类型名;Description:类型说明;Picture:产品样本② CustomerCustomerDemo:客户类型表1相应字段:CustomerID:客户ID;CustomerTypeID:客...
分类:
数据库 时间:
2015-02-10 16:41:04
阅读次数:
260
高维数据的重要属性:数据集的大小随着维数呈指数级增长。在高维样本空间中,需要一个更大的数据才能把小部分的数据放入。在高维度空间中,几乎每一个点都比其他样本点更接近于某一边界。几乎每一个点都是异常点。随着维数的增加,数据密度会越来越小,稀疏。如果样本没增加,只是增加维数,就会导致最终任意两个样本点的距...
分类:
其他好文 时间:
2015-02-09 18:07:39
阅读次数:
113
本题其实就是storm的wordcout,需要把一个gz压缩的文件读取,并使用storm计算其pv. 样本 数据: 存储为accesslog.gz 我把它加载到我的虚拟机中/mnt/下。 没有使用trident,刚学习最基本的。 所以把spout的数目设定为1. 把文件路径存储在config 的ma...
分类:
其他好文 时间:
2015-02-07 14:25:20
阅读次数:
258
贴这个呢,有点不好意思,但是也是加分项。1分也是分。这里要做一个简单介绍。这篇报告呢:1、分析的病毒样本是感染型的。但是呢,它同时又是个后门型的,比较有意思。2、这篇也算是代码级的分析,毕竟用了ollydbg嘛,F7跟了,还手动把壳脱了。大牛别笑话我啊。3、我本人倾向于应用。做过三年的CERT的工作...
分类:
其他好文 时间:
2015-02-07 00:32:08
阅读次数:
272
朴素贝叶斯分类器是用来做分类的一个简便方法。在贝叶斯公式的基础上,引人条件独立的假设,使得贝叶斯分类器具有简单易行的优点和假设时常与实际不符的缺点。下面简单介绍一下朴素贝叶斯分类器。 首先规定一下数据格式:输入的每一个样本为${{x}^{i}},{{c}^{i}}$,其中:$i$为样本编号,$...
分类:
其他好文 时间:
2015-02-06 21:40:19
阅读次数:
147
http://www.blogjava.net/zhenandaci/archive/2008/06/05/205950.html学习方法:使用样例(或称样本,训练集)来合成计算机程序的过程称为学习方法[22]。监督学习:学习过程中使用的样例是由输入/输出对给出时,称为监督学习[22]。最典型的监督...
分类:
其他好文 时间:
2015-02-04 20:10:02
阅读次数:
225
利用scikit-learn进行机器学习简介
Sectioncontents:
在这部分,我们引入利用scikit-learn进行机器学习的常用单词,并给出一些简单的学习例子。
机器学习:问题设置
一般而言,一个学习问题处理一组包含n个样本的数据集,然后预测未知数据的属性。如果每个样本不止有一个数据,例如多维条目(又叫做多维数据),这种情况被称为拥有多组属性或特...
分类:
其他好文 时间:
2015-02-04 16:33:51
阅读次数:
148
(一)神经网络简介 主要是利用计算机的计算能力,对大量的样本进行拟合,最终得到一个我们想要的结果,结果通过0-1编码,这样就OK啦 (二)人工神经网络模型 一、基本单元的三个基本要素 1、一组连接(输入),上面含有连接强度(权值)。 2、一个求和单元 3、一个非线性激活函数,起到将非线性映射作用,并...
分类:
编程语言 时间:
2015-02-03 19:08:20
阅读次数:
221
我们前面已经讲了如何训练稀疏自编码神经网络,当我们训练好这个神经网络后,当有新的样本输入到这个训练好的稀疏自编码器中后,那么隐藏层各单元的激活值组成的向量就可以代表(因为根据稀疏自编码,我们可以用来恢复),也就是说就是在新的特征下的特征值。每一个特征是使某一个取最大值的输入。假设隐藏层单元有200个...
分类:
其他好文 时间:
2015-02-03 16:48:23
阅读次数:
460
从概率论角度,判别分析是根据所给样本数据,对所给的未分类数据进行分类。如下表,已知有t个样本数据,每个数据关于n个量化特征有一个值,又已知该样本数据的分类,据此,求s个未分类数据的分类情况class。Matlab 的统计工具箱提供了判别函数[class,err] = classify(sample,...
分类:
其他好文 时间:
2015-02-03 10:55:03
阅读次数:
437