https://jingyan.baidu.com/article/75ab0bcb8736fcd6864db209.html 1.磁盘阵列是现今非常流行的一种磁盘管理技术,通常称为独立磁盘冗余阵列,也简称为磁盘阵列。按现在流行的等级可分为raid0 raid1 raid2 raid3 raid4 ...
分类:
其他好文 时间:
2020-07-03 15:39:40
阅读次数:
57
```bigFile = "File.txt"appendTest = open(bigFile,"r",encoding="utf8")num = 0for i in appendTest: num += 1 if num == 2: i = "".join([i.strip(),"\"+被处理行... ...
分类:
其他好文 时间:
2020-05-05 14:02:51
阅读次数:
59
Sed简介 Sed是一款流编辑工具,用来对文本进行过滤与替换操作,特别是当你想要对几十个配置文件做统一修改时,你会感受到Sed的魅力!Sed通过一次仅读取一行内容来对某些指令进行处理后输出,所以Sed更适合于处理大数据文件。首先,Sed通过文件或管道读取文件内容,但Sed默认并不直接修改源文件,而是 ...
分类:
其他好文 时间:
2019-10-04 15:04:21
阅读次数:
82
1、查询数据到CSV文件 select * from account into outfile '/root/account.csv' fields terminated by ',' enclosed by '"' lines terminated by '\r\n' 注意:可通过终端方式查询或者 ...
分类:
数据库 时间:
2019-05-22 20:53:09
阅读次数:
169
1. sql查询各表空间使用情况: 2. 表空间不足的解决办法:(表空间尽量让free百分比保持在10%以上,低于10%就增加datafile或者resizedatafile,一般数据文件不要超过2G) 第一种,增加/增大数据文件,扩大表空间 增大数据文件:alter database datafi ...
分类:
其他好文 时间:
2019-03-04 13:09:06
阅读次数:
175
Hadoop与Google一样,都是小孩命名的,是一个虚构的名字,没有特别的含义。从计算机专业的角度看,Hadoop是一个分布式系统基础架构,由Apache基金会开发。Hadoop的主要目标是对分布式环境下的“大数据”以一种可靠、高效、可伸缩的方式处理。设想一个场景,假如您需要grep一个100TB的大数据文件,按照传统的方式,会花费很长时间,而这正是Hadoop所需要考虑的效率问题。 关于Ha
分类:
其他好文 时间:
2018-12-14 14:54:34
阅读次数:
161
--HDFS-- Hadoop Distributed File System HDFS一个分布式,高容错,可线性扩展的文件系统 简介: Hadoop分布式文件系统(HDFS)是一种分布式文件系统,设计用于在商用硬件上运行。它与现有的分布式文件系统有许多相似之处。但是,与其他分布式文件系统的差异很大 ...
分类:
其他好文 时间:
2018-11-23 20:57:09
阅读次数:
312
辛辛苦苦学两年 ,一举回到解放前!!! 大数据开始学真的头疼 关键是linux你玩的不6 唉难受 hadoop 配置参见博客 http://dblab.xmu.edu.cn/blog/install-hadoop/ 权威的东西 接下来是进行HDFS下读写文件 说一下自己遇到的问题 一直说拒接链接,一 ...
分类:
其他好文 时间:
2018-09-30 21:52:41
阅读次数:
208
HDFS是Hadoop集群的文件系统,这是一种分布(distributed)、容错(fault tolerant)的文件系统 所谓分布,是说整个文件系统的内容并非集中存储在一台或几台“文件服务器上”,而是分散在集群的不同节点上 对于大数据文件系统,文件之所以应该是分布式的,不再仅仅是容量和容错的问题 ...
分类:
其他好文 时间:
2018-06-03 16:25:30
阅读次数:
169