存储那些事儿（五）：BTRFS文件系统之Btree结构详解

btree数据结构可以说是btrfs文件系统的基础。它提供了一个通用的方式去存储不同的数据类型。它仅仅存储3个数据类型：key， item和block header。

btrfs_header的定义如下：

btrfs_disk_key的定义如下：

btrfs_item的定义如下：

对于b-tree的非叶子节点，它仅仅保存了[key, block-pointer]。而叶子（leaf）节点则保存了[item, data]。data的大小是不固定的。leaf在开始的地方保存了items的一个数组。而在结尾则以反方向保存了data的数组。这两个数组是向中间增长的。结构体btrfs_item.offset保存了data的偏移量，而btrfs_item.size则保存了data的大小。下面的图可以形象的说明这个问题：

item的data大小是不固定的。并且对于不同的数据结构，这个data的类型也是不一样的。struct btrfs_disk_key::type则说明了data的不同类别。

btrfs_header保存了这个节点数据的一个checksum，拥有这个节点的文件系统的id，这个节点在树中的level，这个节点所占用的block数目。这些成员数据可以在读取数据的时候对元数据进行验证。对于指向这个btree 节点的所有者来说，它会存储generation的值，这能够保证元数据的正确性。

对于指向下层节点的node指针来说，为了简化文件回写的逻辑，下层节点的checksum并不会被保存。generation在节点插入btree时已经被计算出了，但是checksum则仅仅在将这个数据块写回到disk时才会计算。因此，使用generation将会使得btrfs检测到错误的回写。如果使用checksum，那么由于下层节点的checksum仅仅在会写到disk时才会计算，那么计算得到checksum后不得不修改上层指向该节点的checksum，非常低效。

那么generation是怎么计算出来的？就是分配当前节点的transaction id。这样也使得增量备份变得简单。当然了，这个transaction id是被cow的transaction子系统使用的。

对于struct btrfs_key.objectid来说，它唯一标识了该逻辑单元，或者叫object。btrfs就是由这些objects构成的。当object创建时，一个未被其他object使用的object id就会赋给它。objectid可以说是key中最重要的元素。通过objectid，所有的object 都可以组织到b-tree中。

inode

inode是存在struct btrfs_inode_item中的，其中key.offset == 0 并且 key.type == 1。inode的item肯定都是最前面；它们保存了传统文件和目录的状态信息。它相对来说很小，并且不包含内嵌的文件数据或者扩展的属性。这些信息都是保存到其他类型的item中的。

文件

小文件如果可以放到一个leaf 节点的话，它是有可能会被放到扩展的item中的。在这种情况下，key.offset保存了文件数据的在extent中的offset；在btrfs_item.size保存了这个文件的大小。这种文件成为inline file，这种文件由于减少了寻址和io，因此非常快。

对于大文件来说，它们是存到extent中的。struct_file_extent_item存储了这个extent的generation number 和一个[ disk block, disk num blocks ]数对以记录这个文件存储到的磁盘位置。

尊重原创，转载请注明出处 anzhsoft: http://blog.csdn.net/anzhsoft/article/details/20382885

参考资料：

1. https://btrfs.wiki.kernel.org/index.php/btrfs_design

2. btrfs: the linux b-tree filesystem - ibm research

存储那些事儿（五）：BTRFS文件系统之Btree结构详解

继续阅读

Apache (You don't have permission to access / on this server.）

debian9升级4.9.0内核到4.19.2内核过程

centOS7 配置 vsftpd 虚拟用户及权限Vsftpd配置虚拟用户及权限

linux-svn卸载与安装

vsftp虚拟多用户多权限一键部署脚本

Ubuntu14.04 LTS下安装mongodb

Nginx服务优化（1）——隐藏版本号、修改用户与组、网页缓存时间、日志切割、连接超时一、隐藏版本号二、修改用户与组三、配置Nginx网页缓存时间四、实现Nginx日志分割五、配置Nginx实现连接超时六、补充关于时间日期的命令

httpd服务的部署、启动、配置和简单优化一、部署二、启动三、配置文件

配置网页内容访问

手动安装Intel network I217-LM网卡的Linux驱动

禁止ubuntu系统弹出报错界面

Ubuntu Linux下Apache的配置文件

samba服务器的功能

【Linux】UDP广播报文接收速率问题

Linux设备模型（中）之上层容器

PowerPC平台 Linux移植三