码迷,mamicode.com
首页 >  
搜索关键字:mapreduce 实战    ( 20951个结果
WinDbg调试CPU占用高的问题 试验+实战 《第七篇》
一、High CPU试验 1、示例代码 static void Main(string[] args) { Console.Clear(); Console.WriteLine("到命令行下,切换到windbg目录,执行adp...
分类:数据库   时间:2014-05-19 21:44:35    阅读次数:578
Python机器学习实战<一>:环境的配置
具体要学习的书籍就是《机器学习实战》Machine Learning in Action,Peter Harrington Windows下要安装3个文件,分别是; 1.Python(由于python不是向下兼容的,所以推荐2.7版本),网址:http://www.python.org 2.numpy(python的科学计算包),网址:http://sourceforge.net/proje...
分类:编程语言   时间:2014-05-18 09:24:06    阅读次数:303
Python机器学习实战<二>:机器学习概述
1.机器学习的真实含义是利用数据来彰显数据背后的真实含义。 2.机器学习的一般用例:人脸识别、手写数字识别、垃圾邮件过滤、产品推荐等等。 3.机器学习的主要任务是分类,即将实例数据划分到合适的分类中。另一项任务是回归,主要用于预测数值型数据。分类和回归属于监督学习,之所以称为监督学习,是因为这类算法必须知道预测什么,即目标的分类信息。另一种机器学习方式是无监督学习,此时数据没有类别信息,也没有...
分类:编程语言   时间:2014-05-18 08:05:07    阅读次数:320
使用 HTML5 WebSocket 构建实时 Web 应用
HTML5 WebSocket 简介和实战演练本文主要介绍了 HTML5 WebSocket 的原理以及它给实时 Web 开发带来的革命性的创新,并通过一个 WebSocket 服务器和客户端的案例来充分展示 WebSocket 的强大和易用。---- 转自 IBM 孙辉:web前端工程师作为下一....
分类:Web程序   时间:2014-05-16 03:15:40    阅读次数:520
【甘道夫】MapReduce实现矩阵乘法--实现代码
MapReduce实现矩阵乘法--实现代码...
分类:其他好文   时间:2014-05-15 23:57:37    阅读次数:390
java下的多线程操作工具类(原创)
因为毕业设计上需要将控制台的任务实时输出到界面上,而且那是个Hadoop的mapreduce任务,一跑半个小时的节奏,所以需要用到多线程并随时读取返回的数据,百度了没找到合适的方法,于是被逼无奈编写了这个十分简单的多线程操作工具类。大概的功能就是可以执行一个特定的线程(线程必须调用本类的方法才能实现...
分类:编程语言   时间:2014-05-15 21:50:11    阅读次数:366
业务连续性实战
1、统计和收集netapp存储fas3240/2240上的服务器分布情况和使用容量。2、确定迁移顺序,按照操作系统类别windows2003/2008进行p2v准备。3、在6台新刀片上部署vmwarevsphere esxi server 5.5环境,将第二步骤收集的原有系统进行p2v迁移,迁移环境需要较好的ip链路和ip地址资源。链路要求:要求刀片服务供应商准备双向拷贝要求达到1000M网络速率...
分类:其他好文   时间:2014-05-15 20:21:04    阅读次数:348
【虚拟化实战】存储设计之六latency
本文深入介绍Latency过高的原因和一些建议。Latency过高直接导致在该存储上运行虚拟机以及其应用的性能降低。最终用户可能抱怨程序打不开,运行慢,响应时间长等等。...
分类:其他好文   时间:2014-05-15 19:25:27    阅读次数:371
数据导入HBase最常用的三种方式及实践分析
数据导入HBase最常用的三种方式及实践分析         摘要:要使用Hadoop,需要将现有的各种类型的数据库或数据文件中的数据导入HBase。一般而言,有三种常见方式:使用HBase的API中的Put方法,使用HBase 的bulk load工具和使用定制的MapReduce Job方式。本文均有详细描述。        【编者按】要使用Hadoop,数据合并至...
分类:其他好文   时间:2014-05-15 18:15:19    阅读次数:495
非结构化数据的存储与查询
当今信息化时代充斥着大量的数据。海量数据存储是一个必然的趋势。然而数据如何的存储和查询,尤其是当今非结构化数据的快速增长,对其数据的存储,处理,查询。使得如今的 关系数据库存储带来了巨大的挑战。分布存储技术是云计算的基础,主要研究如何存储、组织和管理数据中心上的大规模海量数据.由于面临的数据规模和用户规模更加庞大,在可扩展性、容错性以及成本控制方面面临着更加严峻的挑战[1]。        ...
分类:其他好文   时间:2014-05-15 18:13:55    阅读次数:438
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!