文件系统知识总结
新买的硬盘要存放数据需要怎么做?
首先将硬盘装机做RAID,做完RAID后进行分区,分完区后格式化创建文件系统,最后存放数据。
硬盘的内外部结构:
物理形状:
接口类型:
IDE(Integrated Drive Electronics)即“电子集成驱动器”。
SCSI(Small Computer System Interface)小型计算机系统接口。
SATA(Serial Advanced Technology Attachment)串口硬盘。
SAS(Serial Attached SCSI)串行连接SCSI,是新一代的SCSI技术,向下兼容SATA。
采购磁盘考虑因素:
- 主轴转数:5400/7200/10000/15000/M
- 接口类型:SAS/SATA/SCSI/IDE
- 读写更灵敏的磁头
选型:
- 线上的业务,用SAS磁盘
- 线下的业务,用SATA磁盘,磁带库
- 线上高并发、小容量的业务,用SSD磁盘
Note:千万不要用SATA磁盘来做在线高并发服务的数据存储或数据库业务。
企业生产环境主流磁盘的相关信息对比:
单位容量对比性能和价格:SSD > SAS > SATA >SCSI
单位价格购买磁盘容量:SATA > SAS > SSD
企业生产场景普及程度:SAS > SATA > SSD
SSD固态硬盘(Solid State Drive)用固态电子存储芯片阵列而制成的硬盘,由控制单元和存储单元(FLASH芯片、DRAM芯片)组成。固态硬盘在接口的规范和定义、功能及使用方法上与普通硬盘的完全相同,在产品外形和尺寸上也完全与普通硬盘一致。
固态硬盘优点 |
优点说明 |
启动快 |
没有点击加速转动的过程 |
写入速度快 |
基于DRAM的固态磁盘写入速度极快 |
碎片不影响读取时间 |
相对固定的读取时间。由于寻址时间于数据存储位置无关,因此磁盘碎片不会影响读取时间 |
无噪音 |
因为没有机械马达和风扇,工作时噪音值为0分贝。某些高端或大容量产品装有风扇,因此仍会产生噪音 |
发热量较低 |
低容量的基于闪存的固态磁盘在工作状态下能耗和发热量较低,但高端或大容量产品能耗会较高 |
无机械故障 |
内部不存在任何机械活动部件,不会发生机械故障,也不怕碰撞、冲击、振动。这样即使在高速移动甚至伴随翻转倾斜的情况下也不会影响到正常使用,而且在笔记本电脑发送意外掉落或硬物碰撞时能将数据丢失的可能性降到最小 |
工作温度范围更大 |
普通硬盘只能在5到55℃范围内工作,而大多数固态硬盘能在10~70℃工作,一些工业级的还可以在-40~85℃,甚至更大的温度范围下工作 |
体积小重量轻 |
低容量的固态磁盘比同容量磁盘体积小、重量轻。但这一优势随容量增大而逐渐减弱,直至256GB,固态磁盘仍比同容量的普通硬盘轻 |
抗震动 |
比起传统磁盘,固态磁盘抗震能力要强很多,使得数据能更加安全地保存 |
固态硬盘缺点 |
缺点说明 |
成本高 |
每单位容量价格是传统磁盘的5~10倍(基于闪存),甚至200~300倍(基于DRAM) |
容量低 |
目前固态磁盘最大容量远低于传统磁盘。美国公司Foremay推出了EC188M系列固态磁盘2TB。传统磁盘的容量仍在增长,目前已有4TB的了 |
易受外界影响 |
由于不像传统磁盘那样屏蔽于法拉第笼中,固态磁盘更易受到某些外界因素的不良影响。如断电(基于DRAM的固态磁盘尤甚)、磁场干扰、静电等 |
写入寿命有限 |
写入寿命有限(基于闪存),一般闪存写入寿命为1万到10万次,特制的可达100万到500万,然而整台计算机寿命期间内文件系统的某些部分(如文件分配表)的写入次数仍将超过这一极限。特制的文件系统或者固件可以分担写入的位置,使固态磁盘的整体寿命达到20年以上 |
数据难以恢复 |
数据损坏后难以恢复,一旦在硬件上发送损坏,如果是传统的磁盘或磁带存储方式,通过数据恢复也许还能挽救一部分数据,但是如果是固态存储,一旦芯片发生损坏,想要在碎成几块或电流击穿的芯片中找回数据那几乎是不可能的,当然这种不足也是可以牺牲存储空间来弥补的,主要用RAID |
电池续航较短 |
根据实际测试,使用固态磁盘的笔记本在空闲或低负荷运行下,电池续航短于使用5400RPM的2.5英寸的传统硬盘 |
能耗较高 |
基于DRAM的固态磁盘在任何时候的耗能都高于传统磁盘,尤其是关闭时仍需供电,否则数据丢失 |
Note:运维工作中要合理规划好分层存储机制,根据业务及数据使用频率结合着使用SSD+SAS(15000转/分钟)+SATA(10000转/分钟)。
磁盘相关术语:主轴,盘片,磁道,扇区,0号盘面,磁头,传动手臂,传动轴,起停区,寻道,扇区(标识符(磁头,磁道,扇区号)+数据)
计算磁盘大小公司:磁盘大小=512字节 * 扇区数 * 磁道数 * 磁头数
机械磁盘读写磁盘数据的原理小结:
1、磁盘是按照柱面为单位读写数据的,即先读取同一个盘面的某一个磁道,读完之后,如果数据没有读完,磁头也不会切换到其他的磁道,而是选择切换磁头,读取下一个盘面的相同半径的磁道,直到所有盘面的相同半径的磁道读取完成之后,如果数据还没有读写完成,才会切换其他不同半径的磁道,这个切换磁道的过程称过寻道。
2、不同磁头间的切换时电子切换,而不同磁道间的切换需要磁头做径向运动,这个径向运动需要步进电机调节,这个动作时机械的切换。
磁头寻道是机械运动,切换磁头是电子切换。
RAID:廉价冗余磁盘阵列
做raid最直接的好处:
- 提升数据的安全性
- 提升数据读写性能
- 提供更大的单一逻辑磁盘数据容量
各级RAID优缺点对比:
RAID级别 |
关键优点 |
关键缺点 |
实际应用场景 |
RAID 0 |
读写速度最快 |
没有任何冗余 |
MySQL Slave,集群的节点RS |
RAID 1 |
100%冗余,镜像 |
读写性能一般、成本高 |
单独的,数据重要,且不能宕机的业务,监控,系统盘 |
RAID 5 |
具备一定性能和冗余,可以坏一块盘,读性能不错 |
写入性能不高 |
一般的业务都可以用 |
RAID 10 |
读写速度很快,100%冗余 |
成本高 |
性能和冗余要求都很高的业务,数据库主库和存储的主节点 |
Note:RAID 0不能坏盘,RAID 1允许坏50%的盘,RAID 5允许坏1块盘,RAID 6(专门做硬件存储)允许坏2块盘。
RAID 10和01
磁盘分区
16字节分区表的内容
字节数 |
说明 |
1Bytes |
State:分区状态,0=未激活,0x80=激活 |
1Bytes |
StartHead:分区起始磁头号 |
2Bytes |
StartSC:分区起始扇区和柱面号。低字节的低6位为扇区号,高2位为柱面号的第9,10位;高字节为柱面号的低8位 |
1Bytes |
Type:分区类型,如0x0B=FAT32,0x83=Linux等,00表示此项未用 |
1Bytes |
EndHead,分区结束磁头号 |
2Bytes |
EndSC:分区结束扇区和柱面号,定义同前 |
4Bytes |
Relative:线性寻址方式下分区相对扇区地址(对于基本分区即为绝对地址) |
4Bytes |
Sectors:分区大小(总扇区数) |
分区的本质:修改0磁头0磁道1扇区的前446字节之后的64字节的分区表信息。
分区工具:fdisk(适合给小于2T的磁盘分区),parted(擅长给大于2T的磁盘分区,也可以对小于2T的磁盘分区),首选fdisk,大于2T时才去选parted。
Note:
1、 GUID磁盘分区表(GUIDPartition Table,缩写:GPT)是一个实体硬盘的分区表的结构布局的标准。它是可扩展固件接口(EFI)标准(被Intel用于替代个人计算机的BIOS)的一部分,被用于替代BIOS系统中的一个扇区来存储逻辑块地址和大小信息的主开机纪录(MBR)分区表。因为对于那些扇区为512字节的磁盘,MBR分区表不支持容量大于2.2TB(2.2 × 10^12字节)的分区。
2、 fdisk命令不支持gpt分区方式,parted支持gpt分区方式。
3、 parted的操作是实时的
文件系统
文件系统新增文件操作流程
1、 先确定用户对欲新增文件的目录是否具有w与x的权限,若有的话才能新增;
2、 根据inode bitmap找到没用使用的inode号码,并将新文件的权限/属性写入;
3、 根据block bitmap找到没有使用中的block号码,并将实际的数据写入block中,并更新inode指向数据存放地block;
4、 将刚刚写入的inode与block数据同步更新到inode bitmap与block bitmap中,并更新superblock的内容。
在一般正常的情况下,上述的新增操作当然可以顺利完成,但如果遇到意外情况,就会产生superblock、inode bitmap、block bitmap这些中间数据与实际数据存放区产生不一致的情况。
系统读取数据流程:
1、 找到文件名
2、 找到inode,查看访问权限
3、 找到block
4、 反复循环1-3步骤
格式化(创建文件系统):文件系统是操作系统用于明确在存储设备上组织文件(数据的存储、分级组织、访问和获取等操作)的方法。
格式化(创建文件系统)工具:mkfs
查看系统支持的文件系统格式:ls /lib/modules/`uname -r`/kernel/fs
创建文件系统时会产生一定数量的Inode和Block:
Inode:存放文件的属性信息(包括不限于文件大小、属主(用户)、属组(用户组)、文件权限、文件类型、修改时间,还包含指向文件实体的指针的功能(inode-block对应关系)等,但inode里唯独不包含文件名)。
Block:存储实际数据(图片、视频,普通文件数据)。
文件属性:
inode小结:
1、 磁盘被分区并格式化为ext4文件系统后会生成一定数量的inode和block
2、 inode成为索引节点,它的作用是存放文件的属性信息以及作为文件的索引(指向文件的实体)。
3、 ext3/4文件系统的block存放的是文件的实际内容。
4、 inode是磁盘上的一块存储空间,C6非启动区inode默认大小256字节,C5是128字节。
5、 inode的表现是一串数字,不同的文件对应的inode(一串数字)在文件系统里是唯一的。
6、 inode节点号相同的文件,互为硬链接文件,可以认为是一个文件的不同入口。
7、 ext3/4文件系统下,一个文件被创建后至少要占用一个Inode和block。
8、 ext3/4文件系统下,正常情况一个文件占用且只能占用一个Inode(人和身份证的关系)。
9、 block是用来存储实际数据的,每个block的大小一般有1K,2L,4K几种。其中引导分区等为1K,其他普通分区多为4K(C6)。
10、 如果一个文件很大(高清大片4G),需要占多个block,如果文件很小(0.01K),至少占一个block,并且这个block的剩余空间就浪费了,即无法再存储其他数据了。
11、 查看inode的大小和总量:
dumpe2fs /dev/vda1|egrep -i "block size|Inode size"
dumpe2fs /dev/vda1|egrep -i "block count|Inode count"
12、 查看inode的总量和使用量
命令df -i
13、 查看文件的inode信息方法
ls -li 或stat /etc/hosts
14、 如何生成及指定Inode大小
格式化命令:mkfs.ext4 -b 2048 -I 256 /dev/sdb
block小结:
1、 磁盘要读取数据是按block为单位读取的。
2、 一个文件可能占用多个block。但每读取一个block就会消耗一次磁盘I/O。
3、 如果要提升磁盘IO性能,那么就要尽可能一次读取数据尽量的多。
4、 一个block只能存放一个文件的内容,无论内容有多小。如果block默认是4K大小,那么存放一个1K的文件,剩余3K就不能存放别的文件,只能浪费了。
5、 block并非越大越好。block太大对于存放小文件就会浪费磁盘空间,例如:1000K的文件,block大小为4K,占用250个block,如果block默认为1K,则需要占1000个block。访问效率谁更高?消耗IO分别为250次和1000次。
6、 根据业务需求,确定默认的block大小,如果是大文件(大于16K)一般设置block大一点,小文件(小于1K)一般设置小一点。
7、 block太大,例如4K,文件都是0.1K,大量浪费磁盘空间,但是访问性能高。
8、 block太小,例如1K,文件都是1000K,消耗大量磁盘IO。
9、 block大小设置也是格式化分区时候确定的,命令mkfs.ext4 -b 2048 -I 256 /dev/sdb
10、 企业文件都会比较大(一般会大于4K),block设置大一些会提升磁盘访问效率。
11、 ext3/4文件系统(C5/6),一般都设置为4K。