f2fs源码分析之文件读写过程

时间：2015-11-22 15:38:15 阅读：1159 评论：0 收藏：0 [点我收藏+]

标签：

本篇包括三个部分：1）f2fs 文件表示方法； 2）NAT详细介绍；3）f2fs文件读写过程；4）

下面详细阐述f2fs读写的过程。

管理数据位置关键的数据结构是node，node包括三种：inode、直接node、间接node。其中inode记录了文件的基本信息，包括访问权限、文件大小、修改时间等，也有索引的功能；直接node和间接node单纯负责索引。F2fs的inode中有923个直接数据块索引，2个一级索引，2个二级索引，1个三级索引，文件的逻辑表示如下图：

inode中有923个索引项，直接node、间接node中都是有1018个索引项。

通过上图，inode中923个直接数据块索引能够索引到××K的数据，

2个一级索引能够索引到

2个二级索引能够索引到

1个三级索引能够索引到

因此，f2fs支持单文件最大3.94T，

上面介绍了f2fs三种node之间是如何配合索引文件的，但是有一个非常重要的细节：间接node的索引项记录nid号（与NAT相关），直接node的索引项中直接记录数据块地址。拿图（一）中的三级索引部分为例：

其中node block 1） 2）属于间接node，索引项中为nid号，3）和4）属于直接node，索引项中为数据块的地址。这种设计是为了解决Log-structured 文件系统中雪崩树问题，其中nid号是NAT表的下标。

f2fs文件系统中，NAT表是和文件存储强相关的一个数据结构，非常重要。因此，这篇文章的第二部分，我们就详细说说NAT表，包括它的作用以及f2fs是如何管理NAT表的。

NAT表位于元数据区，可以认为是一个大数组，数据下标是nid，每一个表项记录着一个node块的信息，包括该node块属于哪一个inode，以及该node块在磁盘上的地址。

还是以图（一）中的三级索引部分为例，我们发现，整个索引过程的真相应该是这样的：

这和图一相比已经面目全非了，图一更宏观，本图粒度更细。

到这里我们基本上可以明白f2fs为什么可以削弱雪崩树的影响了：当图中数据块因为数据变脏导致异地更新时，它的直接索引2）也会变脏，但是由于2）是一个直接索引，是node块，信息是在NAT中管理，所以只需要在NAT中update下2）的新地址就好了！这样3）中对应的索引项根本就不用变，因为3）的索引项指向的东西在NAT里呢！

这一机制有效杜绝了雪球越滚越大！但是，这种类似于”二级指针“的方法，会带来一定程度的性能开销，所以f2fs的NAT信息在内存中以链表+基数树的方式维护，以加快查找、update过程。

好了，到这里NAT的作用基本清楚了，后面读写文件的过程还会涉及nat的操作。下面介绍下NAT的存储方式：

元数据区中有两份NAT，两份NAT在元数据区中以segment的粒度交叉存放（假设每个NAT表有3个segment）：

之所以准备两份NAT，是因为f2fs中有两份snapshot，NAT是和文件存储强相关的元数据，因此两份。但是两份snapshort和两份NAT之间并不是一一对应关系，如上图，并不是说第一份快照对应的NAT数据就完全存储在图中NAT0（或者NAT1）中。它是通过一个bitmap，完成NAT在block粒度上的映射：

好了，把NAT介绍完毕后，我们对f2fs文件的索引有了新的认识，下面介绍文件的读写过程：

1）首先在VFS层，

上面介绍了f2fs文件的逻辑表示，下面看f2fs源码中是如何

f2fs源码分析之文件读写过程

标签：

原文地址：http://www.cnblogs.com/honpey/p/4985735.html

踩

(1)

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行