码迷,mamicode.com
首页 > 系统相关 > 详细

Linux文件系统剖析

时间:2016-07-30 15:11:06      阅读:268      评论:0      收藏:0      [点我收藏+]

标签:文件管理   linux   软连接   

   文件系统是学习Linux的一个十分基础的知识,同时也是学习Linux的一个必备知识。本文将站在“上帝视角”对整个文件系统进行进行详细的讲解,主要内容包括文件系统结构元素的组成、文件管理相关命令的使用以及软连接和硬链接的介绍。


一、文件系统结构元素的组成

    大家都知道程序是由指令加数据组成。数据分为元数据和数据。元数据用来存储文件的属性信息,保存在inode节点中,数据则保存在block中。而文件系统是对一个存储设备上的数据和元数据进行组织的机制。

    linux系统文件系统通过使用一组通用的 API 函数,把几乎所有的资源抽象为文件的形式,即我们所说的“一切皆文件”。例如,read 函数调用可以从指定的文件描述符读取一定数量的字节。read () 函数调用可以从指定的文件描述符读取一定数量的字节。open() 函数调用可以从指定的文件描述符打开文件。write()函数调用可以在指定的文件描述符中写入数据。close()函数调用可以关闭指定的文件。


1.文件系统目录标准(FHS)

     Filesystem Hierarchy Standard(文件系统目录标准)的缩写,多数Linux版本采用这种文件组织形式,类似于Windows操作系统中c盘的文件目录,FHS采用树形结构组织文件。FHS定义了系统中每个区域的用途、所需要的最小构成的文件和目录同时还给出了例外处理与矛盾处理。在Linux中,所有的文件与目录都由根目录/ 开始。那是所有目录与文件的源头。然后再一个一个分支下来,有点像树状。因此,我们也称这种目录配置方式为:“目录树(directory tree)”。

[root@node1 ~]#tree -L 1 /
/
├── bin -> usr/bin
├── boot
├── dev
├── etc
├── home
├── lib -> usr/lib
├── lib64 -> usr/lib64
├── media
├── mnt
├── opt
├── proc
├── root
├── run
├── sbin -> usr/sbin
├── srv
├── sys
├── tmp
├── usr
├── var
└── web

这个目录树主要特性有:

    目录树的起始点为根目录(/, root)。

    每一个目录不仅能使用本地端分区的文件系统,也可以使用网络上的文件系统。举例来说,可以利用网络文件系统(Network File System,NFS)服务器载入某特定目录等。

    每一个文件在此目录树中的文件名(包含完整路径)都是独一无二的。

2.文件的路径表示

    绝对路径为:由根目录(/)开始写起的文件名或目录名称,例如/home/dmtsai/.bashrc。

    相对路径为相对于当前路径的文件名写法。

    .:表示当前目录,也可以使用./来表示。

    ..:表示上一层目录,也可以../来表示。

3.文件命名法则

    文件是磁盘上的一段存储空间中存储的数据,它通常基于文件名引用文件;故我们要做到按名存取,知名见义。

    严格区分字符大小写;

    目录是文件的路径映射,从本质上来说也是文件,在同一个路径下,两个文件不能同名;

    支持使用除/以外的所有字符;但不建议使用特殊字符命名文件;

    最长不能超过255个字符。

4.文件系统结构详解

/bin:所有用户可用的基本命令程序文件;

/sbin:实现管理功能的程序文件;

/boot:引导加载器的静态文件;内核、ramdisk(initrd, initramfs)文件亦在此处;能独立分区

/dev:存储特殊文件或设备文件;

/etc:系统和应用程序的配置文件;

/home:普通用户的家目录;能独立分区。每个都有自己专用的家目录;

/root:管理员的家目录;

/lib:共享库文件,以内核模块文件;不能独立分区

/lib64:64位系统特有的存放64位共享库的路径;不能独立分区

/media:挂载便携式设备;

/mnt:挂载临时文件系统;

/opt:第三方应用程序的安装路径(Add-on software packages);

/srv:当前系统提供的服务运行中的用到的中间数据(Data for services provided by this system);

/tmp:临时文件存储位置,所有用户均可使用;使用 ls -ld /tmp 命令查询结果: 显示为 /tmp 为绿色 且权限属性最后一个为t

/usr:/usr Hierarchy,全局共享只读数据;(文件系统第二重要组成部分、第二分区)能独立分区

bin, sbin:可执行程序;

lib, lib64 :库文件;

include:C程序头文件;

share:平台的独立的共享数据文件;

local:第三方应用程序安装路径;

src:程序源代码;

/usr/local:第三方应用程序安装路径;可使用独立分区;

/var:可变数据存储位置;不能独立分区

cache:应用程序缓存数据;

lib:可变状态信息数据;

log:日志文件目录;

lock:锁文件;

run:进程相关的数据,主要用户存储pid文件;

/proc:基于内存的虚拟文件系统; 用于为内核及进程存储其相关信息; 它们多数为内核参数,例如net.ipv4.ip_forward,虚拟为/proc/sys/net/ipv4/ip_forward;以后系统调优多数为        调此目录下的文件参数值

/sys:sysfs虚拟文件系统,是一种提供了比/proc更为理想的访问内核数据的另一个途径;其主要作用在于为管理Linux系统上的设备提供一种统一模型的接口;


二、常用命令的使用

1.显示当前目录:pwd

pwd:printing working directory

    echo  $PWD :显示目录

    echo  $OLDPWD :显示父目录

[root@node1 ~]#cd /tmp
[root@node1 /tmp]#pwd
/tmp
[root@node1 /tmp]#echo $PWD    
/tmp
[root@node1 /tmp]#echo $OLDPWD
/root

2.目录切换:cd

cd:change directory

  用法:cd  [/PATH/TO/SOMEDIR]

cd:切换回家目录;

      注意:bash中,~表示用户的家目录;

cd ~:切换回家目录;

       cd ~USERNAME:切换至指定用户的家目录;只有管理员才有的权限;

cd -:在上一次所在目录与当前目录之间来回切换;此命令比较有用。

[root@node1 ~]#cd /tmp
[root@node1 /tmp]#pwd
/tmp
[root@node1 /tmp]#cd -
/root

3.ls:list,列出指定目录下的内容,默认为当前目录

ls  [OPTION]...  [FILE]...

        -a, --all:显示所有文件,包括.和..在内所有隐藏文件; 

-A, --almost-all 列出目录中除了 “当前目录 .”和“父目录 ..”之外的所有文件,包括隐藏文件

-l:use a long listing format(按长列表输出格式显示)

-F,--classify : append indicator (one of */=>@|) to entries 给条目追加文件类型和标识符,区分文件和目录(*表示系统上可运行的文件)

-h, --human-readable:对数值做单位换算(K表示千字节,M表示兆字节,G表示吉字节);

-i: 显示每个文件的索引值(inode)  

-d:查看目录自身的属性;  

-R:recursive,递归显示;可显示目录及目录里面文件的内容

-r:reverse,降序显示;

--color={never|auto|always}:何时着色显示;

-s:输出每个文件的块大小;

-S: 按文件大小排序输出;

[root@node1 ~]#ls  -l /root
total 4
-rw-r-xr-x  1 root root    0 Jul 30 10:50 1.sh
-rw-------. 1 root root 2639 Jul 12 07:59 anaconda-ks.cfg

 drwxr-xr-x:

 d:文件类型,一个字符;

 rwxr-xr-x:文件权限,permission;

         perm:

         r:readable

         w:writable

         x: excutable

         权限三位一组:

         左三位:属主的访问权限;

         中三位:属组的所有用户的访问权限;

         右三位:其它(other)用户的访问权限;

1:数字,表示文件被硬链接的次数;

root:一个用户名,表示当前文件的属主(owner);

root:一个组名,表示当前文件属组(group);

2639:一个数值,表示当前文件的size,默认单位为字节;可以跟 -h 选项一起使用

Jul  12 08:59 :一个时间,表示文件最近一次被修改的时间;

anaconda-ks.cfg:文件名;


4.显示文件或文件系统的状态:stat

 stat - display file or file system status

语法格式:

stat [OPTION]... FILE...

文件的数据组成部分:

元数据(metadata):文件的元数据是指文件的属性 比如大小、权限、属主属组、时间戳等等;存放于文件系统中的inode; 

数据(data):存放在数据块(data blocks)上;

   注:任何一个磁盘格式化的时候都会把磁盘分为数据区和元数据区;而stat命令主要用于查看inode的相关信息的;

文件的三个时间戳:

最近访问时间(access time:atime),文件最近一次被访问的时间

最近修改时间(modify time:mtime),文件最近一次被修改的时间(数据)

最近改动时间(change time:ctime),文件最近一次改动的时间(元数据)

[root@node1 ~]#stat 1.sh 
  File: ‘1.sh’
  Size: 0         Blocks: 0          IO Block: 4096   regular empty file
Device: 802h/2050dInode: 201368793   Links: 1
Access: (0655/-rw-r-xr-x)  Uid: (    0/    root)   Gid: (    0/    root)
Access: 2016-07-30 10:50:18.860790111 +0800
Modify: 2016-07-30 10:50:18.860790111 +0800
Change: 2016-07-30 10:51:01.820972642 +0800
 Birth: -

5.touch命令

Update the access and modification times of each FILE to the current time

touch - change file timestamps

用法:

    touch [OPTION]... FILE...

-t STAMP:指定时间格式:[[CC]YY]MMDDhhmm[.ss](手动指定时间,如果不指都表示当下时间)

        如# touch -t 201606131434 b

-a:仅修改atime;

-m:仅修改mtime;

-c:不创建文件;

 注:如果touch一个不存在的文件,则会创建一个空文件;

    使用 # touch  $(date +%F-%H-%M-%S) 命令:可以创建一个以当下时间为主的文件

[root@node1 ~]#touch `date +%F-%H-%M-%S`
[root@node1 ~]#ll
total 4
-rw-r-xr-x  1 root root    0 Jul 30 10:50 1.sh
-rw-r--r--  1 root root    0 Jul 30 11:03 2016-07-30-11-03-46
-rw-------. 1 root root 2639 Jul 12 07:59 anaconda-ks.cfg

6.cp命令:copy

cp - copy files and directories

单源复制: cp [OPTION]... [-T]  SOURCE  DEST

多源复制: cp [OPTION]... SOURCE...  DIRECTORY

   cp [OPTION]... -t DIRECTORY SOURCE...

        常用选项:

-i:交互式复制,即覆盖目标文件之前提醒用户确认;

-f:强制覆盖目标文件;

-R, -r, --recursive:递归复制目录及其内容;

-d:same as --no-dereference --preserve=links(保留链接本身的);

-P, --no-dereference:复制链接文件本身,而非默认的复制链接文件指向的源文件的内容(使用此选项复制链接类文件时相当于Windows上的快捷方式操作);

--preserve[=ATTR_LIST]:

指明保留的源文件属性列表:

默认为mode,ownership,timestamps;

额外:context(安全上下文), links(链接), xattr(扩展属性), all

-a, --archive:归档复制(创建备份的)

-dR --preserve=all

注意:仅管理员可保留属主和属组属性;

注:若-i和-f两个选项同时使用时,会提供交互式操作给用户提示

单源复制:cp [OPTION]... [-T]  SOURCE  DEST

如果DEST不存在(仅指基名所指定的文件不存在,路劲本身必须存在):则复制时先创建DEST文件,而后复制源文件的内容导入至目标文件;

如果DEST事先存在:

                        如果DEST是非目录文件:则覆盖目标文件;此操作极其危险,考虑到此centos定义 “cp=cp -i” 命令选项,提供交互式命令在复制时会有所提示;使用 \cp 可                          以使用命令本身,不使用命令别名);

如果DEST目录:则在此目录中创建一个与原文件同名的文件,则导入其内容;

[root@node1 ~]#alias |grep cp
alias cp=‘cp -i‘
[root@node1 ~]#mkdir testdir
[root@node1 ~]#cp 1.sh  testdir/
[root@node1 ~]#cp 1.sh  testdir/
cp: overwrite ‘testdir/1.sh’? y
[root@node1 ~]#\cp  1.sh  testdir/

多源复制:

 基本前提:仅允许一种情形 DEST存在,且必须是目录;否则即为错误; 

[root@node1 ~]#cp 1.sh anaconda-ks.cfg  testdir/
cp: overwrite ‘testdir/1.sh’? y
[root@node1 ~]#ls testdir/
1.sh  anaconda-ks.cfg
[root@node1 ~]#cp 1.sh anaconda-ks.cfg  nodir
cp: target ‘nodir’ is not a directory

7.mv命令

Rename SOURCE to DEST, or move SOURCE(s) to DIRECTORY. Mandatory arguments to long options are mandatory for short options too.

    mv - move (rename) files

    mv [OPTION]... [-T] SOURCE DEST

    mv [OPTION]... SOURCE... DIRECTORY

    mv [OPTION]...  -t DIRECTORY  SOURCE...

    常用选项:

     -i, --interactive:使用交互式选项操作

     -f, --force  do not prompt before overwriting

         注意:源文件目录与目标文件目录相同时,为rename机制;否则即为move。 

      无论移动的源文件是文件还是目录都不需要使用-R选项

8.rm命令

rm - remove files or directories

rm [OPTION]... FILE...

常用选项:

-i, --interactive

-f, --force

-r, -R, --recursive:递归删除目录及其内容(和cp命令一样,删除目录时需要使用此选项);

    注意:Linux没有回收站功能,所以不要随意执行 “rm -rf  /”或“rm -rf  /*” 命令!


三、bash的特性之glob

glob:文件名通配;快速引用多个文件;文件名整体匹配度检测;

元字符:基于元字符可编写匹配模式(pattern);

*:匹配任意长度的任意字符;

?:匹配任意单个字符;

[ ]:匹配指定集合内的任意单个字符;

[a-z], [A-Z]:不区分字符大小写;

[0-9] :0-9之间的任意单个数字

[a-z0-9]:既有字母又有数字的集合

 字符集合表示:

[[:upper:]]:所有大写字母;

[[:lower:]]:所有小写字母;

[[:digit:]]:所有的数字;

[[:alpha:]]:所有字母;

[[:alnum:]]:所有字母和数字;

[[:space:]]:空白字符;

[[:punct:]]:标点符号(punctuation);

[^ ]:匹配指定集合外的任意单个字符;

[^[:alpha:]]:所有的非字母集合

三、软连接和硬链接

1.Linux链接概念

Linux链接分两种,一种被称为硬链接(Hard Link),另一种被称为符号链接(Symbolic Link)。默认情况下,ln命令产生硬链接。

2.硬连接

硬连接指通过索引节点来进行连接。在Linux的文件系统中,保存在磁盘分区中的文件不管是什么类型都给它分配一个编号,称为索引节点号(Inode Index)。在Linux中,多个文件名指向同一索引节点是存在的。一般这种连接就是硬连接。硬连接的作用是允许一个文件拥有多个有效路径名,这样用户就可以建立硬连接到重要文件,以防止“误删”的功能。其原因如上所述,因为对应该目录的索引节点有一个以上的连接。只删除一个连接并不影响索引节点本身和其它的连接,只有当最后一个连接被删除后,文件的数据块及目录的连接才会被释放。也就是说,文件真正删除的条件是与之相关的所有硬连接文件均被删除。

3.软连接

另外一种连接称之为符号连接(Symbolic Link),也叫软连接。软链接文件有类似于Windows的快捷方式。它实际上是一个特殊的文件。在符号连接中,文件实际上是一个文本文件,其中包含的有另一文件的位置信息。

4.通过实验加深理解

[oracle@Linux]$ touch f1          #创建一个测试文件f1
[oracle@Linux]$ ln f1 f2          #创建f1的一个硬连接文件f2
[oracle@Linux]$ ln -s f1 f3       #创建f1的一个符号连接文件f3
[oracle@Linux]$ ls -li            # -i参数显示文件的inode节点信息
total 4
201364821 -rw-------. 1 root root 2639 Jul 12 07:59 anaconda-ks.cfg
201368793 -rw-r--r--  2 root root    0 Jul 30 11:31 f1
201368793 -rw-r--r--  2 root root    0 Jul 30 11:31 f2
201364836 lrwxrwxrwx  1 root root    2 Jul 30 11:32 f3 -> f1

  从上面的结果中可以看出,硬连接文件f2与原文件f1的inode节点相同,均为201368793,然而符号连接文件的inode节点不同。

[oracle@Linux]$ echo "I am f1 file" >>f1
[oracle@Linux]$ cat f1
I am f1 file
[oracle@Linux]$ cat f2
I am f1 file
[oracle@Linux]$ cat f3
I am f1 file
[oracle@Linux]$ rm -f f1
[oracle@Linux]$ cat f2
I am f1 file
[oracle@Linux]$ cat f3
cat: f3: No such file or directory

通过上面的测试可以看出:当删除原始文件f1后,硬连接f2不受影响,但是符号连接f1文件无效

5.总结

依此您可以做一些相关的测试,可以得到以下全部结论:

    1).删除符号连接f3,对f1,f2无影响;

    2).删除硬连接f2,对f1,f3也无影响;

    3).删除原文件f1,对硬连接f2没有影响,导致符号连接f3失效;

    4).同时删除原文件f1,硬连接f2,整个文件会真正的被删除。



   


    

    

本文出自 “11243407” 博客,请务必保留此出处http://11253407.blog.51cto.com/11243407/1831989

Linux文件系统剖析

标签:文件管理   linux   软连接   

原文地址:http://11253407.blog.51cto.com/11243407/1831989

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!