1.概述 在大数据的浪潮下,时时刻刻都会产生大量的数据。比如社交媒体、博客、电子商务等等,这些数据会以不同的类型存储在不同的平台里面。为了执行ETL(提取、转换、加载)操作,需要一个消息中间件系统,该系统应该是异步和低耦合的,即来自各种存储系统(如HDFS、Cassandra、RDBMS等)的数据可 ...
分类:
其他好文 时间:
2021-03-01 13:50:00
阅读次数:
0
1.windows下调试时需要将hadoop.dll文件放到C:\Windows\System32下,网上很多说改源码的,其实这样也是ok的,不然会报权限错误 Exception in thread "main" java.lang.UnsatisfiedLinkError: org.apache. ...
当在终端执行sudo命令时,系统提示“hadoop is not in the sudoers file”: 其实就是没有权限进行sudo,解决方法如下(这里假设用户名是cuser): 1.切换到超级用户:$ su 2.打开/etc/sudoers文件:$vim /etc/sudoers 3.修改文 ...
分类:
其他好文 时间:
2021-02-25 11:47:06
阅读次数:
0
我们一般会在项目根目录加上.gitignore文件,但是有些初始的项目并没有这个文件,于是需要我们主动增加这个文件。 文件的参考内容如下: .DS_Store node_modules/ /dist/ npm-debug.log* yarn-debug.log* yarn-error.log* /t ...
分类:
其他好文 时间:
2021-02-23 14:18:35
阅读次数:
0
前言 昨天还是周末,公司群里就有人@,说集群有问题了,敲完Hive一直卡在那里进不去,于是我很快登上WebUi,看到了这么一幕:这台节点的磁盘满了,其他的数据分布都比较平均 为什么会这样 这里就不得不说一下HDFS复本存放策略了: namenode如何选择在哪个datanode存储复本(replic ...
分类:
其他好文 时间:
2021-02-20 12:16:37
阅读次数:
0
1、概念 HBase是一个分布式的NoSQL数据库,其特点高可靠、高性能、面向列、可伸缩。 适合存储大表数据 ,并且可实时读写大表数据。大表:表的规模可以达到数十亿行以及数百万列 表结构稀疏。稀疏:对于为空的列,并不占用存储空间 数据底层存储于Hadoop HDFS分布式文件系统。 利用ZooKee ...
分类:
其他好文 时间:
2021-02-19 13:36:07
阅读次数:
0
Hadoop Beginner's Guide.pdf item description 封面 初版时间 2014-01-01 出版社 人民邮电出版社 作者 Garry Turkington 页数 310 Hadoop技术内幕:深入解析MapReduce架构设计与实现原理.pdf item desc ...
分类:
其他好文 时间:
2021-02-19 13:06:46
阅读次数:
0
##Hbase和Hive Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。HBase是Hadoop的数据库,一个分布式、可扩展、大数据的存储。单个的从字面意思上或许很难看出二者的 ...
分类:
其他好文 时间:
2021-02-19 12:52:56
阅读次数:
0
不会 webpack 还想学 vue 工程化开发 的福音 熟悉jQuery开发的,学习vue的简单使用是没用啥问题的,但是学习vue的工程化开发方式,往往会遇到各种问题,比如: webpack、node、npm、cnpm、yarn、脚手架、开发环境、测试环境、生产环境、各种安装、各种创建。 好在 v ...
分类:
Web程序 时间:
2021-02-17 15:03:59
阅读次数:
0
1 命令: https://www.cnblogs.com/mmit/p/12639011.html npm i cnpm -g --registry=https://registry.npm.taobao.org cnpm install -g create-react-app create-re ...
分类:
其他好文 时间:
2021-02-17 14:10:02
阅读次数:
0