码迷,mamicode.com
首页 >  
搜索关键字:mapreduce 实战    ( 20951个结果
朴素贝叶斯
参考《机器学习实战》 朴素(naive)贝叶斯遵循以下原则: 设特征为x,y;类别为c。 在已知x、y特征的情况下,判断其类为ci的概率为: 自然, 我们选取概率较大的为对应的分类结果: 朴素贝叶斯就是根据这一原则进行分类器设计的。书中以垃圾邮件分类为例做了详述。 垃圾邮件分类的基本过程: 数据集:...
分类:其他好文   时间:2014-06-06 23:35:03    阅读次数:526
Hadoop 组成
这里介绍一下hadoop的组成, hadoop主要由两部分组成,,一个是hdfs,还有一个是mapreduce这两个部分在hadoop 2.2.0中分别用start-dfs.sh和start-yarn.sh启动。mapreduce 在2.0版本号中有了一个新名字yarn.dfs 主要用来启动 nam...
分类:其他好文   时间:2014-06-06 19:27:24    阅读次数:322
XSS高级实战教程
1、【yueyan科普系列】XSS跨站脚本攻击--yueyan2、存储型XSS的成因及挖掘方法--pkav3、跨站脚本攻击实例解析--泉哥4、XSS高级实战教程--心伤的瘦子5、XSS利用与挖掘-更新版--GAINOVER6、XSS教学--gainoverXSS教学XSS实战教程PKAV培训网站:h...
分类:其他好文   时间:2014-06-06 16:26:07    阅读次数:283
MongoDB MapReduce
目前发现mapreduce的用法有两种:一:计数以及实现聚合函数统计数据二:对数据进行分组简化或者构造自己想要的格式三:根据条件进行数据筛选现在普遍的用法是第一种,对于第二种用法我们会分析一些格式怎么构造。效果图mapreduce原理:参考资料:http://www.csdn.net/article...
分类:数据库   时间:2014-06-06 16:01:35    阅读次数:390
机器学习实战:数据预处理之独热编码(One-Hot Encoding)
问题由来在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。例如,考虑一下的三个特征:["male","female"]["from Europe","from US","from Asia"]["uses Firefox","uses Chrome","uses Safari","uses...
分类:其他好文   时间:2014-06-04 17:03:02    阅读次数:344
列式存储设计实战
背景: 开发个学生系统,数据库设计。设计实施:传统数据库学生表行设计学号姓名性别年龄1张三男162李红女153王五男16当想扩展属性时,相对应的会增加字段。学号姓名性别年龄住址1张三男16河南2李红女15湖北3王五 男16北京实际开发中这样做的缺点:1:属性字段向主表加,会导致列越来越多,增加表.....
分类:其他好文   时间:2014-06-02 16:26:56    阅读次数:231
利用SQL处理DataGrid表格问题
在最初选定这个控件作为表格的显示容器来说,也曾经尝试使用mshflexgrid控件。毕竟第一次机房收费系统就使用的那个控件。控件的好坏咱不做评价。     mshflexgrid这个控件,类似于excel,使用的时候需要循环赋值,然后再显示出来。期间运行多长时间,我不太清楚。总感觉很浪费吧。之后又接触了一个DataGridView控件,虽然表格的显示都差不多,用法也几乎类似。 在使用三层架构的...
分类:数据库   时间:2014-06-02 12:36:12    阅读次数:287
使用ADO.NET对SQL Server数据库进行访问
在上一篇博客中我们给大家简单介绍了一下VB.NET语言的一些情况,至于理论知识的学习我们可以利用VB的知识体系为基础,再将面向对象程序设计语言的知识进行融合便可进行编程实战。          如果我们需要访问一个企业关系数据库(比如SQL Server或者Oracle),并且需要包含由复杂关系构成的表中的数据,如何去实现?我们可以利用ADO.NET内置功能提取并操作数据,就想插入、更新和删除S...
分类:数据库   时间:2014-06-02 02:33:46    阅读次数:823
hadoop备战:yarn框架的简介(mapreduce2)
hadoop yarn的重构,根本的思想是将 JobTracker 两个主要的功能分离成单独的组件,这两个功能是资源管理和任务调度 / 监控。新的资源管理器全局管理所有应用程序计算资源的分配,每一个应用的 ApplicationMaster 负责相应的调度和协调。一个应用程序无非是一个单独的传统的 MapReduce 任务或者是一个 DAG( 有向无环图 ) 任务。ResourceManager 和每一台机器的节点管理服务器能够管理用户在那台机器上的进程并能对计算进行组织。...
分类:其他好文   时间:2014-06-02 02:27:16    阅读次数:332
hadoop备战:yarn框架的搭建(mapreduce2)
x86台式机,window7 64位系统 wmware虚拟机(x86的台式机至少是4G内存,才能开2台虚机) centos6.4操作系统 hadoop-2.2.0.tar.gz jdk-6u24-linux-i586.bin WinScp 远程文件传输工具,很好用。可以用于windows和虚拟机Linux之间文件相互拷贝。...
分类:其他好文   时间:2014-06-02 02:23:23    阅读次数:315
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!