码迷,mamicode.com
首页 >  
搜索关键字:anaconda 数据挖掘 机器学习    ( 12837个结果
如何将CentOS5升级到CentOS6
在让读者们继续看下去之前,我觉得很有必要开门见山的讲清楚:将CentOS5升级到CentOS6是无法通过yum或rpm等工具进行升级的。根据CentOS官网的描述,直接升级是不支持的,除了yum和rpm不能之外,anaconda也必须使用全新安装(Freshinstallation)才能升级成功(不能使用升级安装..
分类:其他好文   时间:2014-05-27 04:01:45    阅读次数:290
数据挖掘最常见的十种方法
数据挖掘最常见的十种方法下面介绍十种数据挖掘(Data Mining)的分析方法,以便于大家对模型的初步了解,这些都是日常挖掘中经常遇到的算法,希望对大家有用!(甚至有数据挖掘公司,用其中的一种算法就能独步天下)1、基于历史的MBR分析(Memory-Based Reasoning;MBR)基于历史...
分类:其他好文   时间:2014-05-24 00:17:58    阅读次数:301
Mahout机器学习平台之聚类算法详细剖析(含实例分析)
第一部分: 学习Mahout必须要知道的资料查找技能: 学会查官方帮助文档:        解压用于安装文件(mahout-distribution-0.6.tar.gz),找到如下位置,我将该文件解压到win7的G盘mahout文件夹下,路径如下所示: G:\mahout\mahout-distribution-0.6\docs 学会查源代码的注释文档:        方案一:用ma...
分类:其他好文   时间:2014-05-22 10:37:07    阅读次数:388
hadoop家族的各个成员
这篇文章不提原理,讲讲hadoop及其周边项目的作用。 hadoop这个词已经流行好多年了,一提到大数据就会想到hadoop,那么hadoop的作用是什么呢? 官方定义:hadoop是一个开发和运行处理大规模数据的软件平台。核心词语是平台,也就是说我们有大量的数据,又有好几个电脑,我们知道应该把处理数据的任务分解到各个电脑上,但是不知道怎样分配任务,怎样回收结果,hadoop大概就帮助我们做了...
分类:其他好文   时间:2014-05-22 10:34:39    阅读次数:288
大数据的三个入口
大数据的热门使得很多人都想往这个方向发展,做一些像数据挖掘,数据分析之类的工作。但是该从何开始呢?要怎样才能快速学到一些有用的知识,技能呢?我觉得有三个切入点,依照个人特点可以自行选择顺序切入。...
分类:其他好文   时间:2014-05-22 10:33:54    阅读次数:232
数据转换技术的应用
随着网络信息时代的发展,数据转换技术也在不断的飞速发展。人们可以通过计算机与互联网联接,从世界各地实时的接收和发送大量、最新的信息,但在信息交换的过程中存在着一个突出的问题,就是多种多样的数据格式,给信息的有效使用带来了障碍。所以在信息时代,如何以最便捷、最可靠、最有效的方式获取所需的信息是一个很大的困扰。如何让用户在必要的时刻快速简单的得到必要的数据--HYFsoft(北京红樱枫软件有限公司)的数据格式转换技术日益受到社会的瞩目。...
分类:其他好文   时间:2014-05-22 10:20:13    阅读次数:270
机器学习之路
机器学习入门教材有许多,入门方式多种多样,我是半路出家,简单总结一下我的机器学习之路。2011年考入北邮计算机研究生学院,主要是NLP方向。之前没有接触过机器学习,本科也不是计算机专业,而是工商管理。 2011年研究生阶段,两节课对我影响很大: 第一节课是计算语言学,最开始了解和接触机器学习,是在上这节课的时候,老师推荐的教材《统计自然语言处理基础》。在老师的课上,有讲到HMM(隐马尔...
分类:其他好文   时间:2014-05-22 08:24:51    阅读次数:307
语音交互技术——语音基础
语音技术是研究用数字信号处理技术和机器学习方法对语音信号进行处理的一门学科。语音技术的目的: 得到某些参数以便高效传输或存储;或者是用于某种应用,如人工合成出语音、辨识出讲话者、识别出讲话内容、进行语音增强等。 语音编码:在保持可以接受的失真的情况下,采用尽可能少的比特数表示语音。脉冲编码调制(PC...
分类:其他好文   时间:2014-05-21 21:53:13    阅读次数:320
机器学习实战-决策树(ID3)
//====================================================决策树的构造:构造决策树时,需要解决的第一个问题是,当前数据集上那个特征在划分数据是起决定性作用。为了找到决定性特征,我们必须使用某种度量来评估每个特征。完成评估之后,找到决定性特征,使用该特...
分类:其他好文   时间:2014-05-21 18:05:53    阅读次数:343
Python机器学习实战<三>:k-邻近算法
k邻近算法采用测量不同特征值之间的距离方法进行分类。优点:精度高、对异常值不敏感、没有数据输入假定;缺点:计算复杂度高、空间复杂度高(占内存);使用数据范围:数值型和标称型。 k-邻近算法的工作原理是:存在一个训练样本集,并且每个数据都存在标签,即我们知道每个数据都对应的哪个分类。输入一个没有标签的新数据,将新数据的每个特征和样本集中的所有数据进行笔记哦啊,提取出样本集中特征最相似(邻近)的分类...
分类:编程语言   时间:2014-05-20 16:54:05    阅读次数:534
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!