码迷,mamicode.com
首页 >  
搜索关键字:处理海量数据    ( 186个结果
大数据Hadoop生态圈:Pig和Hive
前言 Pig最早是雅虎公司的一个基于Hadoop的并行处理架构,后来Yahoo将Pig捐献给Apache的一个项目,由Apache来负责维护,Pig是一个基于 Hadoop的大规模数据分析平台。 Pig为复杂的海量数据并行计算提供了一个简 易的操作和编程接口,这一点和FaceBook开源的Hive一 ...
分类:其他好文   时间:2017-11-05 15:08:00    阅读次数:161
Hadoop学习笔记系列文章导航
一、为何要学习Hadoop? 这是一个信息爆炸的时代。经过数十年的积累,很多企业都聚集了大量的数据。这些数据也是企业的核心财富之一,怎样从累积的数据里寻找价值,变废为宝炼数成金成为当务之急。但数据增长的速度往往比cpu和内存性能增长的速度还要快得多。要处理海量数据,如果求助于昂贵的专用主机甚至超级计 ...
分类:其他好文   时间:2017-11-03 13:02:11    阅读次数:197
Chapter 1 Java开发前奏
第1章:初识Java 1.1 计算机的基础知识 1.1.1 计算机 计算机(Computer)全称:电子计算机,俗称电脑。是一种能够按照程序运行,自动、高速处理海量数据的现代化智能电子设备。由硬件和软件所组成,没有安装任何软件的计算机称为裸机。常见的形式有台式计算机、笔记本计算机、大型计算机等。 计 ...
分类:编程语言   时间:2017-10-27 01:27:38    阅读次数:209
计算机基础
01.什么是计算机?计算机在生活中的应用举例 计算机(Computer)全称:电子计算机,俗称电脑。是一种能够按照程序运行,自动、高速处理海量数据的现代化智能电子设备。由硬件和软件所组成,没有安装任何软件的计算机称为裸机。常见的形式有台式计算机、笔记本计算机、大型计算机等。 应用举例: * 1:科学 ...
分类:其他好文   时间:2017-10-20 10:07:04    阅读次数:133
计算机简史,硬件组成及基本原理
计算机 计算机(computer)俗称电脑,是一种用于高速计算的电子计算机器,可以进行数值计算,又可以进行逻辑计算,还具有存储记忆功能。是能够按照程序运行,自动、高速处理海量数据的现代化智能电子设备。由硬件系统和软件系统所组成,没有安装任何软件的计算机称为裸机。 计算机发明者约翰·冯·诺依曼。计算机 ...
分类:其他好文   时间:2017-10-12 17:53:12    阅读次数:208
计算机基础知识--基础知识
计算机发展介绍 计算机硬件组成 计算机基本原理 计算机 计算机(computer)俗称电脑,是一种用于高速计算的电子计算机器,可以进行数值计算,又可以进行逻辑计算,还具有存储记忆功能。是能够按照程序运行,自动、高速处理海量数据的现代化智能电子设备。由硬件系统和软件系统所组成,没有安装任何软件的计算机 ...
分类:其他好文   时间:2017-10-07 16:30:22    阅读次数:250
Java在处理大数据的时候一些小技巧
http://soft.chinabyte.com/database/258/12609258.shtml 众所周知,java在处理数据量比较大的时候,加载到内存必然会导致内存溢出,而在一些数据处理中我们不得不去处理海量数据,在做数据处理中,我们常见的手段是分解,压缩,并行,临时文件等方法; 例如, ...
分类:编程语言   时间:2017-09-15 10:14:41    阅读次数:187
Chapter 1 Java开发前奏
第1章:初识Java 1.1 计算机的基础知识 1.1.1 计算机 计算机(Computer)全称:电子计算机,俗称电脑。是一种能够按照程序运行,自动、高速处理海量数据的现代化智能电子设备。由硬件和软件所组成,没有安装任何软件的计算机称为裸机。常见的形式有台式计算机、笔记本计算机、大型计算机等。 计 ...
分类:编程语言   时间:2017-09-09 09:42:21    阅读次数:297
《生物信息学》——李霞;;生信概念
挑战:寻找新的处理海量数据和复杂性的方法。 生信:说了什么: 研究对象: 以核酸、蛋白质等生物大分子数据库 研究手段方法:数学、信息学、计算机科学 研究工具: 计算机硬件、软件、计算机网络 研究目的: 对浩如烟海的原始数据进行获取、加工、存储、分配、分析、管理、注释解释,使之成为具有明确生物意义的生 ...
分类:其他好文   时间:2017-08-31 14:34:08    阅读次数:168
hadoop 大数据 介绍
1.Hadoop是一个大家族,是一个开源的生态系统,是一个分布式运行系统,是基于Java编程语言的架构。不过它最高明的技术还是HDFS和MapReduce,使得它可以分布式处理海量数据。 2.HDFS(分布式文件系统):它与现存的文件系统不同的特性有很多,比如高度容错(即使中途出错,也能继续运行), ...
分类:其他好文   时间:2017-08-09 18:08:40    阅读次数:164
186条   上一页 1 ... 5 6 7 8 9 ... 19 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!