码迷,mamicode.com
首页 >  
搜索关键字:sqoop 大数据 hadoop 数据预处理 sqoop2    ( 25615个结果
那些Python集合中神秘的招式
Python有3大数据类型,列表,字典和集合,列表和字典前面我都讲过了,今天我们来聊聊Python中的集合.Python的书里面完整全面讲集合的不多,即使有的也只是简单带过,笔墨不多。大部分介绍Python数据结构都是被列表,字典两大网红遮盖了锋芒.貌似集合在Python的世界里很冷门,其实集合里面的东西很有用,有它特定的适用的场景,特别是在数据处理的时候.大显身手.那么说起集合,很多人一定想到了
分类:编程语言   时间:2020-11-27 11:10:27    阅读次数:8
Hadoop框架:MapReduce基本原理和入门案例
MapReduce既是一个编程模型,也是一个计算组件,处理的过程分为两个阶段,Map阶段:负责把任务分解为多个小任务,Reduce负责把多个小任务的处理结果进行汇总。其中Map阶段主要输入是一对Key-Value,经过map计算后输出一对Key-Value值;然后将相同Key合并,形成Key-Value集合;再将这个Key-Value集合转入Reduce阶段,经过计算输出最终Key-Value结果集。
分类:其他好文   时间:2020-11-26 14:53:23    阅读次数:6
计数器
package com.atguigu.etl; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.NullWritable; impo ...
分类:其他好文   时间:2020-11-25 13:04:03    阅读次数:26
我要进大厂之大数据MapReduce知识点(2)
01 我们一起学大数据 今天老刘分享的是MapReduce知识点的第二部分,在第一部分中基本把MapReduce的工作流程讲述清楚了,现在就是对MapReduce零零散散的知识点进行总结,这次的内容大纲如下图: 02 需要谨记的知识点 第6点:自定义分区 在上篇文章里的第五点提到过这句话:分区用到了 ...
分类:其他好文   时间:2020-11-25 12:39:39    阅读次数:6
大数据组件
1.大数据架构图谱 文件系统 HDFS Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。 GlusterFS 是一个集群的文件系统 ...
分类:其他好文   时间:2020-11-25 12:06:50    阅读次数:8
Hadoop全分布模式启动集群
一、 初始化工作: 1. 准备三台机器 hostanme IP 用途 master 192.168.0.10 namenode node1 192.168.0.11 datenode node2 192.168.0.12 datenode 在三台机器上做下面的动作 2. 编辑/etc/hosts 1 ...
分类:其他好文   时间:2020-11-23 12:38:36    阅读次数:12
我要进大厂之大数据Hadoop HDFS知识点(1)
01 我们一起学大数据 老刘今天开始了大数据Hadoop知识点的复习,Hadoop包含三个模块,这次先分享出Hadoop中的HDFS模块的基础知识点,也算是对今天复习的内容进行一次总结,希望能够给想学大数据的同学一点帮助,也希望能够得到大佬们的批评和指点!(每个点都很重要,都不能忽视) 02 需谨记 ...
分类:其他好文   时间:2020-11-23 12:18:23    阅读次数:6
EDA云实证Vol.4:国内最大规模OPC上云,5000核并行,效率提升53倍
上一篇《EDA云实证Vol.1:从30天到17小时,如何让HSPICE仿真效率提升42倍?》里,我们帮一家Design House提高了使用HSPICE进行芯片设计仿真的效率。 而设计好的集成电路图案需要通过光刻机转印到晶圆上才能完成制造,这就是芯片制造中最重要的一个步骤——光刻。 在先进工艺特别是 ...
分类:其他好文   时间:2020-11-23 11:48:59    阅读次数:5
docker
@ 1.Docker概述 1.1Docker为什么会出现 一款产品:开发--》上线,需要两套环境!应用环境,应用配置! 开发 运营之间产生问题:我在我的电脑上可以运行!版本更新导致服务不可用!对于运维就很难 开发即运维! 环境配置十分麻烦,每一个机器都要部署环境(集群Redis、ES、Hadoop。 ...
分类:其他好文   时间:2020-11-21 12:47:24    阅读次数:31
认识Hive
认识Hive 从MapReduce到SQL Hive架构 三种安装方式 Hive与关系型数据库的区别 1. 认识Hive 前面我们讲到了mapreduce计算框架,各位需要通过java编码的形式来实现设计运算过程,Hive的设计目的就是为了让精通sql技能而java较弱的分析师能够利用hadoop进 ...
分类:其他好文   时间:2020-11-21 12:33:40    阅读次数:7
25615条   上一页 1 ... 27 28 29 30 31 ... 2562 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!