使用hexdump追踪FAT32文件系统中的一个文件

  最近在看文件系统基础结构等知识,本来重点是想看EXT4文件系统,但是目前没有找到比较详细说明EXT4文件系统详细结构的,用EXT3的对应着找结果有点出入,在想是不是我用hexdump的参数有问题,于是找了一个FAT32文件系统来试验hexdump参数的使用,结果准确找到了文件内容,在这里记录一下。

  •   操作系统:linux(centos6.5)
  •   文件系统:FAT32(来自于U盘)
  •   工具:hexdump,windows自带计算器

        hexdump是linux操作系统中用来查看文件二进制内容的一种工具,win10打开windows自带计算器方法:windows+R然后输入Calc.exe回车

  •   参考书目:《数据重现-文件系统原理精解与数据恢复最佳实践》(马林 著)

  步骤:

  FAT32文件系统结构:

保留区 FAT区 数据区

1、查看文件系统相关信息:

  df -T

解释:df可查看文件系统磁盘空间使用情况,-T选项可查看文件系统类型,以下是查看结果:

  

 

可以看到文件系统/dev/sdb为文件系统类型为vfat也就是FAT32类型(具体的目录就是插入的u盘),下面就是对该文件系统进行追踪。这里要追踪的文件是:childTEXT.txt,可从挂载点查看文件内容,childTEXT.txt的基本情况如下:

  

  文件内容及基本信息:

  

2、查看引导扇区,得到每扇区字节数、每簇扇区数、保留扇区数、FAT表占用扇区数、FAT表个数、根目录起始簇号,进而定位FAT表、根目录、数据区位置。

  命令:hexdump -s 0 -n 512 -C /dev/sdc

解释: 选项-s指偏移量,单位是字节,默认是十进制,也可以在数字前加上"0X"表示十六进制;

      -n选项表示要读取的字节数,只能用十进制表示,引导扇区占一个扇区,一般为512个字节;

       -C选项可以输出十六进制对应的ASCII码,要注意这里的是大写的C,小写的c选项表示单字节字符显示;

     /dev/sdc为文件系统名

查看结果:

  

 2.1得到基本数据:

  首先可以看到偏移0x1fe-1ff处为“55aa”也就是引导扇区的结束标志。

  0x0b-0x0c是每扇区字节数:0x0200(十进制的512)

  0x0d是每簇扇区数:0x10(十进制的16)

  0x0e-0x0f是保留扇区数:0x26(十进制38)

  0x10是FAT表个数:0x02(十进制2)

  0x24-0x27是一个FAT表扇区数:0x3e71(十进制15985)

  0x2c-0x2f是根目录起始簇号:0x02(十进制2)

2.2定义FAT表

      从FAT32文件系统结构可以看出,FAT区紧跟在保留区后面,因此引导扇区中获取保留区扇区数后就可以得到FAT区起始位置。

      FAT起始字节=保留区扇区数*每扇区字节数

      0x26*0x200=0x4c00(十进制19456)

计算FAT区大小:FAT区所占字节数=每FAT表所占扇区数*每扇区字节数*FAT表个数

        0x3e71*0x200*0x02=0xf9 c400(十进制16,368,640)

读取命令:

  hexdump -s 0x4c00 -n 1024 -C /dev/sdc

读取结果:

  

上面是FAT表部分内容,FAT表中四个字节为一个表项。

  当某个簇未使用时,对应的FAT表项值为0x00000000;

  当该簇是某个文件最后一个簇时,对应表项值为0x0fffffff(大端形式为:ff ff ff 0f);

  当该簇为坏簇时;FAT表项值为0x0ffffff7(f7 ff ff 0f);

  因为簇号起始于2号(FAT表项与簇是一一对应关系),因此FAT表项0,1项不与任何簇对应,其0号表项值总为“f8 ff ff 0f”;1表项可能用于记录脏标志(说明文件系统没有被正常卸载或磁盘表面存在错误),其表项值一般为“ffffffff”或“ffffff0f”。

2.3定位根目录

  根目录位于数据区的开始,因此定位根目录就是定位数据区的开始。

数据区紧跟FAT区后,所以数据区的开始扇区号就是保留区+FAT区扇区号:

   数据区起始扇区号=保留区扇区个数+每FAT表扇区个数*FAT表个数

    0x26+0x3e71*0x02=0x7d08(十进制32008)

    偏移字节:0x7d08*0x200=0xfa1000(十进制16388096)

读取结果:

  

 

3、从根目录中由子目录名来查找子目录的起始簇号和起始扇区号。

  上图中可以看到我们要找的目录RootDIR有两个,这是因为根目录有32字节的短文件名目录项和32字节或更多个32字节的长文件名目录项,一般在短文件名目录项的前面(如果多于一个32字节,则倒序存放)

  找到需要的目录项:

  0x10c0-0x10ca为文件名,剩余文件名空间用0x20补齐。“52 4f 4f 54 44 49 52 20 20 20 20”,这里要说明一下,文件名的第一个字节比较特殊,当该文件被删除时,文件名的第一个字节就被改写为0xe5(未被使用是0x00)

  0x10cb是文件属性:0x10表示目录

  0x10da-0x10db是文件内容起始簇号低两个字节:0x5123(高两个字节位置是0x10d4-0x10d5,这里全为0)

  0x10dc-0x10df是文件内容大小字节数:0x00000000,当文件属性为目录时,该值为0。

  0x5123就是子目录RootDIR的起始簇号。

  利用簇号找到他相对应的扇区号的公式是:

  某簇对应的扇区号=保留区扇区个数+FAT区扇区个数+(簇号-2)*每次扇区个数

            0x26+0x3e71*2+(0x5123-0x02)*0x10=0x58f18(十进制364312)

  簇号对应的偏移字节:0x58f18*0x200=0xb1e3000。

4、从子目录中找到目标文件。

  上一步中计算的0xb1e3000就是子目录的偏移字节。

  依旧使用hexdump命令读取子目录内容:

  

  在子目录中,我们看到前64个字节的文件名比较特殊,第一个32字节的文件名是“.”表示本目录,证据就是该目录起始簇号的低两个字节是0x5123,就是第三步中我们找到的RootDIR目录的起始簇号;第二个32字节的文件名是“..”表示根目录。

  其次还可以看到目标子目录项的前后两个子目录都被删除了。

目标子目录项提供的信息:

  0x30a0-0x30aa:文件名

  0x30ab是文件属性:0x20表示存档文件

  0x30ba-0x30bb是文件内容起始簇号的低两个字节:0x5126

  0x30bc-0x30bf是文件内容大小:0x2e(十进制46,与第一步中我们用ls -l命令查看文件基本情况相符)

  使用和第3步同样的方法计算出0x5126簇号对应的扇区号:

    0x26+0x3e71*0x02+(0x5126-2)*0x10=0x58f48

  偏移字节为:0x58f48*0x200=0xb1e9000

5、从起始簇号开始读取文件第一个簇内容。

  使用上一步中计算出的偏移字节读取文件第一个簇的内容:

  

  这里的示例文件大小小于一个簇(8192个字节),我们在第4步中已经知道他的大小为46个字节,因此可以使用下面命令准确读出文件内容。

  

6、查看FAT表项值,查找文件下一个簇内容。

  查找簇号为0x5126的FAT表项值就可以找到该文件的下一个簇。

  簇号对应的FAT表项值=簇号*每个FAT表项值所占字节数

  0x5126*0x04=0x14498(十进制83096)

  也就是说0x5126号簇的FAT表内偏移字节为0x14498,要想从开始算起则加上FAT区的起始字节就可以了。

  某簇对应FAT表的绝对字节偏移=保留扇区数*每扇区字节数+簇号*每FAT表项字节数

  0x14498+0x4c00=0x19098

  读取偏移0x19098开始的4个字节内容

  

  该表项值为0x0fffffff,表示该簇就是该文件的结束簇,文件读取结束。

到这里,利用hexdump追踪一个文件就结束了,居然写了一下午/(ㄒoㄒ)/~~,后续会追踪一个被删除的文件内容看看。

 

posted @ 2016-08-03 16:49  姜姜csu  阅读(1087)  评论(0编辑  收藏  举报