在你已经安装部署并允许MongoDB服务后,你必须要了解MongoDB的运行情况,并查看MongoDB的性能。这样在大流量得情况下可以很好的应对并保证MongoDB正常运作。 MongoDB中提供了mongostat 和 mongotop 两个命令来监控MongoDB的运行情况。 mongostat ...
分类:
数据库 时间:
2020-11-10 10:44:09
阅读次数:
9
Hadoopnamenode高可用性分析:QJM核心源代码解读背景介绍HDFSnamenode在接受写操作时会记录日志,最早HDFS日志写本地,每次重启或出现故障后重启,通过本地镜像文件+操作日志,就能还原到宕机之前的状态,不会出现数据不一致。如果要做高可用(HA),日志写在单个机器上,这个机器磁盘出现问题,重启就恢复不了,导致数据不一致,出现的现象就是新建的文件不存在,删除成功的还在等诡异现象。
分类:
其他好文 时间:
2020-11-07 17:00:30
阅读次数:
24
1.词频统计 a.下载喜欢的电子书或大量文本数据,并保存在本地文本文件中 b.编写map与reduce函数 c.本地测试map和reduce d.将文本数据上传到HDFS上 e.用hadoop streaming提交任务 f.查看运行结果 g.计算结果取回本地 ...
分类:
其他好文 时间:
2020-11-07 16:36:45
阅读次数:
33
1.下载喜欢的电子书或大量文本数据,并保存在本地文件夹中 2.编写map与reduce函数 3.本地测试map与reduce 4.将文本数据上传至HDFS上 5.用hadoop streaming提交任务 6.查看运行结果 7.计算结果取回到本地 ...
分类:
其他好文 时间:
2020-11-07 16:32:22
阅读次数:
17
1.下载喜欢的电子书或大量文本数据,并保存在本地文本文件中 2编写map与reduce函数 3本地测试map与reduce 4将文本数据上传至HDFS上 5.用hadoop streaming提交任务 6.查看运行结果 7.计算结果取回到本地 ...
分类:
其他好文 时间:
2020-11-07 16:17:20
阅读次数:
18
将.txt格式文件插入Hbase中,代码如下 package addHbase; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.ap ...
分类:
其他好文 时间:
2020-11-06 02:49:19
阅读次数:
37
import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.*;import org.apache.hadoop.hbase.client.*;import org.apache.hadoop.hbase.ut ...
分类:
其他好文 时间:
2020-11-06 01:37:17
阅读次数:
15
知乎HBase实践前言HBase是一个基于Hadoop面向列的非关系型分布式数据库(NoSQL),设计概念来源于谷歌的BigTable模型,面向实时读写、随机访问大规模数据集的场景,是一个高可靠性、高性能、高伸缩的分布式存储系统,在大数据相关领域应用广泛.HBase系统支持对所存储的数据进行透明切分,从而使得系统的存储以及计算具有良好的水平扩展性.知乎从2017年起开始逐渐采用HBase系统存储各
分类:
其他好文 时间:
2020-11-06 01:07:32
阅读次数:
22
环境: 操作系统:ubuntu 12.10 64bit jdk:sun jdk 1.6 64bit hadoop:apache hadoop 1.02 hbase:apache hbase 0.92 先决条件:配置apache hadoop append,默认这个属性是false,需要设置为true ...
分类:
其他好文 时间:
2020-11-04 18:45:23
阅读次数:
16
由于业务需要windows机器运行程序,沟通之后发现团队里大家并没有windows相关的运维经验,一番调研后决定以虚机+cygwin方式作为管理方案。一、cygwin的安装部署我们可以到Cygwin的官方网站下载Cygwin的安装程序,地址是:http://www.cygwin.com/,下载完成后,运行setup.exe程序,出现安装画面。直接点“下一步”即可。这里无需过多阐述。注意这里有三种安