码迷,mamicode.com
首页 >  
搜索关键字:样本    ( 4292个结果
k-means浅谈
基本知识:算法标签:聚类、贪心、划分算法算法目标:使得簇尽可能紧凑和独立(低耦合,高聚合)评价准则:所有对象的误差平方和算法复杂度:O(nkt),n是样本数目,k是簇数,t是迭代次数算法限制:簇的均值是有定义的(标称属性无法计算均值,此时可以改用k众数)算法缺点:k值需给定,初始点选择对算法有影响,...
分类:其他好文   时间:2015-04-17 09:38:08    阅读次数:130
PE文件加节感染之Win32.Loader.bx.V病毒分析
一、病毒名称:Win32.Loader.bx.V 二、分析工具:IDA 5.5、OllyDebug、StudPE 三、PE病毒简介: PE病毒感染的方式比较多,也比较复杂也比较难分析,下面就针对PE文件感染之加节的方式进行汇编层次的深度分析,其实说来惭愧,第一接触这个病毒样本的时候也有 点手足无措,最后还是在别人的指导下才顺利的分析下来,开始分析该样本的时候,仅仅关注这个样本是木马病毒这个...
分类:Windows程序   时间:2015-04-16 09:10:56    阅读次数:282
机器学习实战ByMatlab(二)PCA算法
PCA 算法也叫主成分分析(principal components analysis),主要是用于数据降维的。为什么要进行数据降维?因为实际情况中我们的训练数据会存在特征过多或者是特征累赘的问题,比如: 一个关于汽车的样本数据,一个特征是”km/h的最大速度特征“,另一个是”英里每小时“的最大速度特征,很显然这两个特征具有很强的相关性 拿到一个样本,特征非常多,样本缺很少,这样的数据用回归去你和将...
分类:编程语言   时间:2015-04-15 23:27:39    阅读次数:303
判别分析
1. 定义 距离判别问题的数学描述: 设有n个样本,对每个样本测得p项指标(变量)的数据,已知每个样本属于k个类别(或总体)G1,G2, …,Gk中的某一类,且它们的分布函数分别为F1(x),F2(x), …,Fk(x)。我们希望利用这些数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于...
分类:其他好文   时间:2015-04-15 21:16:42    阅读次数:210
机器学习实战——朴素贝叶斯
from numpy import * # 创建一个实验样本 def loadDataSet(): postingList = [['my','dog','has','flea','problems','help','please'], ['maybe','not','take','him','to','dog','park','stupid'...
分类:其他好文   时间:2015-04-15 19:38:37    阅读次数:160
AdaBoost学习思考
近期需要做一个TransferLearing的大作业,就先总结一下自己学习AdaBoost的一些思考       一直以来人们都想通过对分类器分错的样本构建单独的分类器来增加分类准确率,所以AdaBoost出现以前就有了boostrapping方法和bagging方法     AdaBoost历史: 1)bootstrapping方法的主要过程   主要步骤:   i)重...
分类:其他好文   时间:2015-04-15 13:42:37    阅读次数:360
机器学习与模式识别学习总结(一)
有幸用最近两个月的业余时间把”统计机器学习”一书粗略的学习了一遍,同时结合“模式识别”、“数据挖掘概念与技术”的知识点,对机器学习的一些知识结构进行梳理与总结: 机器学习包括两个主要问题1、学习什么,2、怎么学习。 首先来梳理一下学习什么 一、学习什么 1.        要解决什么问题?机器学习中主要解决以下三类问题: a)        监督学习问题:给定输入输出集(即人工标记的样本...
分类:其他好文   时间:2015-04-14 21:36:54    阅读次数:165
优化Linux下的内核TCP参数以提高系统性能
内核的优化跟服务器的优化一样,本着稳定安全的原则。下面以64位的CentOS5.5下的Squid服务器为例来说明,待客户端与服务器端建立TCP/IP连接后就会关闭SOCKET,服务器端连接的端口状态也就变为TIME_WAIT了。那是不是所有执行主动关闭的SOCKET都会进入TIME_WAIT状态呢?有没有什..
分类:系统相关   时间:2015-04-14 20:20:11    阅读次数:193
最小二乘法和最大似然估计
一:背景:当给出我们一些样本点,我们可以用一条直接对其进行拟合,如y= a0+a1x1+a2x2,公式中y是样本的标签,{x1,x2,x3}是特征,当我们给定特征的大小,让你预测标签,此时我们就需要事先知道参数{a1,a2}。而最小二乘法和最大似然估计就是根据一些给定样本(包括标签值)去对参数进行估计参数估计的方法>。   二:最小二乘法: 基本思想: 简单地说,最小二乘的思想就是要使得观...
分类:其他好文   时间:2015-04-13 22:58:32    阅读次数:173
MHA 配置文件样本描述
与绝大多数Linux应用程序类似,MHA的正确使用依赖于合理的配置文件。MHA的配置文件与mysql的my.cnf文件配置相似,采取的是分模块,param=value的方式来配置,配置文件位于管理节点,通常包括每一个mysql server的主机名,mysql用户名,密码,工作目录等等。本文列出了单套MHA以及采用全局配置来管理多套MHA配置文件的一些样例,供大家参考。...
分类:其他好文   时间:2015-04-13 20:58:15    阅读次数:216
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!