码迷,mamicode.com
首页 >  
搜索关键字:数据集    ( 7694个结果
取数据集代码编辑器
import java.lang.reflect.Field; /** *@desc 根据结果集获取其setVO的各个字符串str * 例如:类名xx.xx.xx.Testvo ,属性 name, 返回:TestVO.setName(StringUtil.nullToEmpty(rowSet.getString("name"))); *@author xxx *@sinc...
分类:其他好文   时间:2014-10-13 01:29:28    阅读次数:171
机器学习实战学习笔记(一)
1、k-近邻算法算法原理:存在一个样本数据集(训练样本集),并且我们知道样本集中的每个数据与其所属分类的对应关系。输入未知类别的数据后将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似(最近邻)的k组数据。然后将k组数据中出现次数最多的分类,来作为新数据的分类。算法步...
分类:其他好文   时间:2014-10-12 20:39:28    阅读次数:199
数据集成之主数据管理(一)基础概念篇
数据集成是当下比較热门的话题,相关的产品和平台也越来越多。非常多CIO都在各种数据集成平台和产品之间犹豫不决。因此对数据集成平台的框架体系有全面的理解,对各个厂家产品所提供的功能有深入的认识才干为数据平台选型的决策提供可靠的保证。我有幸參与了国内一个知名企业的集成平台的设计工作,并主导了数据集成平台...
分类:其他好文   时间:2014-10-12 18:53:38    阅读次数:311
数据库相关知识
1、数据库是一个结构化的数据集合; 2、数据环境是对象,关系是数据环境中的对象; 3、在结构化方法中,用数据流程图(DFD)作为描述工具的软件开发阶段是:需求分析 4、在软件生命周期中,能准确地确定软件系统必须...
分类:数据库   时间:2014-10-12 14:20:08    阅读次数:238
机器学习之单变量线性回归(Linear Regression with One Variable)
1. 模型表达(Model Representation) 我们的第一个学习算法是线性回归算法,让我们通过一个例子来开始。这个例子用来预测住房价格,我们使用一个数据集,该数据集包含俄勒冈州波特兰市的住房价格。在这里,我要根据不同房屋尺寸所售出的价格,画出我的数据集: 我们来看这个数据集,如果你有一个...
分类:其他好文   时间:2014-10-12 07:16:57    阅读次数:337
两个有关矩阵求导的问题
对于$D$维数据集$X$,若其样本$\boldsymbol{x}$服从$\mathcal{N} (\boldsymbol{x} | \boldsymbol{\mu}, \boldsymbol{A})$,那么用极大似然法对协方差矩阵$\boldsymbol{A}$进行估计时,则不可避免会遇到\be.....
分类:其他好文   时间:2014-10-12 04:37:17    阅读次数:286
学习理论
1. 偏差和方差平衡在线性回归中,对于同一个数据集,可以拟合出简单的线性模型或者较为复杂一些的多项式例如:图中的训练样本是一致的,但是可以拟合出不同的模型。最右边图中拟合出的5阶多项式,并不见得就是一个好模型,虽然该模型能够准确预测出样本点的y值,因为这种模型过分拟合了训练样本(过拟合),当对非训练...
分类:其他好文   时间:2014-10-12 01:39:27    阅读次数:272
如何生成符合高斯分布的数据集
在网上搜了下,维基百科中给了多种方法。 http://en.wikipedia.org/wiki/Normal_distribution#Generating_values_from_normal_distribution...
分类:其他好文   时间:2014-10-12 01:26:17    阅读次数:474
用R建立岭回归和lasso回归
1分别使用岭回归和Lasso解决薛毅书第279页例6.10的回归问题例6.10的问题如下:输入例题中的数据,生成数据集,并做简单线性回归,查看效果cement<-data.frame(X1=c(7,1,11,11,7,11,3,1,2,21,1,11,10),X2=c(26,29,56,31,52,55,71,31,54,47,40,66,68),X3=c(6,15,8,8,6,9,17,22,..
分类:其他好文   时间:2014-10-10 16:41:54    阅读次数:33313
R语言多元分析系列
R语言多元分析系列之一:主成分分析主成分分析(principal components analysis, PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成...
分类:编程语言   时间:2014-10-10 15:45:34    阅读次数:433
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!