通过文件头准确识别PHP上传的文件类型

通过文件头准确识别PHP上传的文件类型

在做web应用时候,通过web扩展名判断上存文件类型,这个是我们常使用的。有时候我们这样做还不完善。可能有些人上存一些文件,但是他通过修改扩展名,让在我们的文件类型之内。 单实际访问时候又不能展示(因为扩展名与文件内容不符)。下面这个php类,可能能够给我们带来帮助。

首先说明下,上面文件头与文件类型映射关系来自网上,如果你有新的文件需要检查,只需要将映射加入即可。 如果你需要知道文件头信息,可以通过工具:winhex打开标准文件查找。如:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
<?php     
               
/*通过文件名,获得文件类型*    
*@author chengmo QQ:8292669*    
*@copyright <A href="http://www.xuehuwang.com">http://www.xuehuwang.com/</A> 2010-10-17    
*@version 0.1    
*$filename="d:/1.png";echo cFileTypeCheck::getFileType($filename); 打印:png    
*/
class cFileTypeCheck    
{    
    private static $_TypeList=array();    
    private static $CheckClass=null;    
    private function __construct($filename)    
    {    
        self::$_TypeList=$this->getTypeList();    
    }    
               
    /**    
     *处理文件类型映射关系表*    
     *    
     * @param string $filename 文件类型    
     * @return string 文件类型,没有找到返回:other    
     */
    private function _getFileType($filename)    
    {    
        $filetype="other";    
        if(!file_exists($filename)) throw new Exception("no found file!");    
        $file = @fopen($filename,"rb");    
        if(!$file) throw new Exception("file refuse!");    
        $bin = fread($file, 15); //只读15字节 各个不同文件类型,头信息不一样。    
        fclose($file);    
                       
        $typelist=self::$_TypeList;    
        foreach ($typelist as $v)    
        {    
            $blen=strlen(pack("H*",$v[0])); //得到文件头标记字节数    
            $tbin=substr($bin,0,intval($blen)); ///需要比较文件头长度    
                           
            if(strtolower($v[0])==strtolower(array_shift(unpack("H*",$tbin))))     
            {    
                return $v[1];    
            }    
        }    
        return $filetype;    
    }    
                   
    /**    
     *得到文件头与文件类型映射表*    
     *    
     * @return array array(array('key',value)...)    
     */
    public function getTypeList()    
    {    
        return array(array("FFD8FFE1","jpg"),    
        array("89504E47","png"),    
        array("47494638","gif"),    
        array("49492A00","tif"),    
        array("424D","bmp"),    
        array("41433130","dwg"),    
        array("38425053","psd"),    
        array("7B5C727466","rtf"),    
        array("3C3F786D6C","xml"),    
        array("68746D6C3E","html"),    
        array("44656C69766572792D646174","eml"),    
        array("CFAD12FEC5FD746F","dbx"),    
        array("2142444E","pst"),    
        array("D0CF11E0","xls/doc"),    
        array("5374616E64617264204A","mdb"),    
        array("FF575043","wpd"),    
        array("252150532D41646F6265","eps/ps"),    
        array("255044462D312E","pdf"),    
        array("E3828596","pwl"),    
        array("504B0304","zip"),    
        array("52617221","rar"),    
        array("57415645","wav"),    
        array("41564920","avi"),    
        array("2E7261FD","ram"),    
        array("2E524D46","rm"),    
        array("000001BA","mpg"),    
        array("000001B3","mpg"),    
        array("6D6F6F76","mov"),    
        array("3026B2758E66CF11","asf"),    
        array("4D546864","mid"));    
    }    
               
    public static function   getFileType($filename)    
    {    
        if(!self::$CheckClass) self::$CheckClass=new self($filename);    
        $class=self::$CheckClass;    
        return $class->_getFileType($filename);    
    }    
}

通过WinHex软件来获取文件的头信息:

可以看到:png 文件,头是4个字节(头标记是多少字节需要自己查相关资料确定),对应是:89504E47

调用方法:

1
2
3
4
$filename="d:/1.png";
echo $filename,"\t",cFileTypeCheck::getFileType($filename),"\r\n";
$filename="d:/test.doc";
echo $filename,"\t",cFileTypeCheck::getFileType($filename),"\r\n";

输出为:

1
2
d:/1.png    png
d:/test.doc    xls/doc
posted @ 2013-03-22 10:10  火腿骑士  阅读(695)  评论(0)    收藏  举报