搜索关键字：sqoop 大数据 hadoop 数据预处理 sqoop2，搜索到25615个结果！码迷,mamicode.com！

在Eclipse中执行、配置Hadoop

版权全部： zhe-jiang.he@hp.com 严禁转载！1.安装插件准备程序：eclipse-3.3.2（这个版本号的插件仅仅能用这个版本号的eclipse）hadoop-0.20.2-eclipse-plugin.jar （在hadoop-0.20.2/contrib/eclipse-plu...

分类：系统相关时间：2014-06-03 12:15:46 阅读次数：414

乒乓操作

乒乓操作的优势：乒乓操作常常应用于流水线式算法，完成数据的无缝缓冲与处理。节省缓冲区空间可以使用低速模块处理高速模块第三点的实现方式：（实例） A端输入速率1Mbps的信号，DPRAM存储量大于1M bit，数据流运算处理模块的处理速度为1 Mps，数据预处理模块1&2的处理速度是0.5 Mbps；...

分类：其他好文时间：2014-06-03 08:22:17 阅读次数：218

Android开发之适配器-ListView适配器的重复数据

适配器是Android中的数据与View视图的桥梁，作用就是将数据通过适配器显示到对应的View视图上。工作中，在用ListView做适配器数据时候，有些人肯定碰见过，如何优化效率，但是又出现重复数据的情况，如何避免重复数据而且又能提高ListView大数据量时候的效率呢？，解决方案就是2点：1. ...

分类：移动开发时间：2014-06-03 07:19:16 阅读次数：300

用python做中文自然语言预处理

这篇博客根据中文自然语言预处理的步骤分成几个板块。以做LDA实验为例，在处理数据之前，会写一个类似于实验报告的东西，用来指导做实验，OK，举例：一，实验数据预处理（python,结巴分词）1.对于爬取的评论做分词和词性标注处理(mac-result.txt)2.对于结果只用公版的停用词表去停用词，不...

分类：编程语言时间：2014-06-03 06:45:21 阅读次数：385

Redis VS Memcached 转载

引子：在大数据时代，总希望存在一个Key-value存储机制，像HashMap一样在内存中处理大量（千万数量级）的key-value对，以便提高数据查找、修改速度。所以，我们会想到，Memcached和Redis这两个NoSQL数据库（严格来讲二者都不可以算作数据库）。 1、Memcach...

分类：其他好文时间：2014-05-31 15:35:29 阅读次数：293

hadoop备战：hadoop,hbase兼容版本号汇总

Hbase的安装须要考虑Hadoop的版本号，即兼容性。有不足的希望能指出。下面考究官网得到的，关于hadoop版本号和hbase版本号可到下面网址中下载：http://mirror.bit.edu.cn/apache/hbaseHBase-0.92.xHBase-0.94.xHBase-0.96....

分类：其他好文时间：2014-05-31 15:24:19 阅读次数：377

JAVA开发人员画图表总结（ECHARTS）

随着大数据的到来，越来越多的数据需求需要开发，而这些需求不可避免需要使用JS画出图表，而大多后端JAVA开发人员对JS不太熟悉，导致身心倍受折磨，今天记录以下最近我使用echarts的步骤，供参考：一、环境说明前端框架：echarts、Jquery后端框架：SPRINGMVC二、开发过程前端代码：I...

分类：编程语言时间：2014-05-31 11:43:58 阅读次数：433

Solr与HBase架构设计

本篇是本人在做一个大数据项目时，对于系统架构的一点总结，如何在保证存储量的情况下，又能保证数据的检索速度。

分类：其他好文时间：2014-05-30 20:34:01 阅读次数：405

用python + hadoop streaming 编写分布式程序（二） -- 在集群上运行与监控

写在前面前文：用python + hadoop streaming 编写分布式程序（一） -- 原理介绍，样例程序与本地调试为了方便，这篇文章里的例子均为伪分布式运行，一般来说只要集群配置得当，在伪分布式下能够运行的程序，在真实集群上也不会有什么问题。为了更好地模拟集群环境，我们可以在mapred-...

分类：编程语言时间：2014-05-30 14:56:56 阅读次数：309

Apache Spark源码走读之12 -- Hive on Spark运行环境搭建

Hive是基于Hadoop的开源数据仓库工具，提供了类似于SQL的HiveQL语言，使得上层的数据分析人员不用知道太多MapReduce的知识就能对存储于Hdfs中的海量数据进行分析。由于这一特性而收到广泛的欢迎。Hive的整体框架中有一个重要的模块是执行模块，这一部分是用Hadoop中MapRed...

分类：其他好文时间：2014-05-30 14:23:07 阅读次数：409

共25615条上一页 1 ... 2523 2524 2525 2526 2527 ... 2562 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)