[译]JavaScript:如何判断值的类型

原文:http://www.adobe.com/devnet/html5/articles/categorizing-values-in-javascript.html


本文中,我将会解释JavaScript一共有几种类型的值,以及如何判断一个值的类型.这将有助于你更好的理解JavaScript是如何工作的.也能帮你实现更高级的编程任务,比如在需要处理各种不同类型的传入值的地方,写一个完善的库进行处理.有了本文中的知识,你就能够避免因两个不同值之间存在细微的差别而引起的bug.

我将会给你展示四种判断值的类型的方法:通过隐藏属性[[Class]],通过typeof运算符,通过instanceof运算符,以及通过函数Array.isArray().我还会解释在进行类型判断时,为什么内置构造函数的原型对象会有一些不可思议的分类结果.

目录

1.回顾基础知识

2.判断值的类型

3.内置原型对象

4.建议

5.接下来该学习什么

回顾基础知识

在开始文章的正式部分之前,你需要复习一些必要的知识.

原始值和对象值

JavaScript中的所有值不是原始值就是对象值.

原始值.下面的值都是原始值:

  • undefined
  • null
  • 布尔值
  • 数字
  • 字符串

原始值是不可变的;你不能给它们添加属性:

> var str = "abc";
> str.foo = 123; // 尝试添加属性"foo" 123 > str.foo // 并没有添加上 undefined

另外,原始值是通过值来比较的,也就是,如果它们有相同的内容,就被认为是相等的:

> "abc" === "abc" 
true

对象值.所有的非原始值都是对象值.对象值是可变的:

> var obj = {};
> obj.foo = 123; // 尝试添加属性"foo" 123 > obj.foo // 属性"foo"被成功添加 123

对象值是通过引用来比较的.每个对象都有自己唯一的标识符,因此,两个对象只有在是同一个对象的情况下才视为相等:

> {} === {} 
false

> var obj = {};
> obj === obj
true

包装对象类型

原始值类型boolean,number以及string都有自己对应的包装对象类型Boolean,Number和String.后面这几个类型的实例都是对象值,且和它们各自包装的原始值类型有很多不同点:

> typeof new String("abc") 
'object'
> typeof "abc"
'string'
> new String("abc") === "abc"
false

包装对象类型很少被直接使用,但它们的原型对象定义了许多其对应的原始值也可以调用的方法.例如,String.prototype是包装类型String的原型对象.它的所有方法都可以使用在字符串原始值上.包装类型的方法String.prototype.indexOf.字符串原始值上也有,并不是两个拥有相同名称的方法,而的的确确就是同一个方法:

> String.prototype.indexOf === "".indexOf 
true

内部属性

内部属性是一些无法用JavaScript代码直接访问的属性,但它们会隐式的影响代码运行结果.内部属性的名称以大写字母开头,且两边用双下划线包围起来.例如, [[Extensible]]就是一个内部属性,存储着一个布尔值,表明能否在该对象身上添加属性.它的值只能被引擎内部管理.Object.isExtensible()可以读取这个内部属性的值,Object.preventExtensions()可以将它的值设置为false.它的值一旦成为false,就不可能再修改回true.

术语:原型和原型对象的区别

在JavaScript中,术语"原型(prototype)"很不幸的可能会有点歧义:

  1. 一方面,对象之间有"谁是谁的原型"这个关系.每个对象都有一个隐藏属性[[Prototype]],指向了自己的原型(可以是对象值或者原始值null).一个对象的原型是该对象的延续.如果在该对象上访问一个属性,却没有找到,则会继续去它的原型上找.多个对象可能有相同的原型.
  2. 另一方面,如果一个对象obj是由一个构造函数Foo实例化的,那么构造函数Foo会有一个属性Foo.prototype,对象obj的原型就指向这个属性.

说的再清晰点,开发者们通常把(1)中对象的"[[prototypes]]"内部属性称之为原型,把(2)中函数的"prototype"属性称之为原型对象.有三个方法可以用来操作对象的原型:

  • Object.getPrototypeOf(obj)返回对象obj的原型:
    > Object.getPrototypeOf({}) === Object.prototype
    true
  • Object.create(proto)创建一个原型是proto的空对象:
    > Object.create(Object.prototype)
    {}
    Object.create()还可以做更多的其他事,但已经超过本文的介绍范围了.
  • proto.isPrototypeOf(obj)返回true,如果proto是obj的原型 (或者原型的原型,依次类推):
    > Object.prototype.isPrototypeOf({})
    true

"constructor"属性

给定一个构造函数Foo,它的原型对象Foo.prototype会有一个属性Foo.prototype.constructor,该属性的值又指向回Foo.对于大部分用户定义的函数来说,其prototype属性以及prototype属性的constructor属性都会自动生成.(译者注:通过Function.prototype.bind创建的绑定函数没有原型对象,typeof function(){}.bind({}).prototype;  // "undefined")

> function Foo() { } 
> Foo.prototype.constructor === Foo
true
> RegExp.prototype.constructor === RegExp
true

构造函数的所有实例都会从其原型对象上继承到constructor属性.因此,你可以用它来判断一个实例是由哪个构造函数创建的:

> new Foo().constructor 
[Function: Foo]
> /abc/.constructor
[Function: RegExp]

判断值的类型

这里有四种方式可以用来进行值的分类:

  • [[Class]]是一个内部属性,值为一个类型字符串,可以用来判断对象值的类型.
  • typeof是一个运算符,用来判断原始值的类型,还可以用来区分原始值和对象值.
  • instanceof是一个可以判断对象值类型的运算符.
  • Array.isArray()是一个函数,用来判断某个值是否是数组.

[[Class]]

[[Class]]是一个内部属性,它的值可能是下面字符串中的一个:

"Arguments", "Array", "Boolean", "Date", "Error", "Function", "JSON", "Math", "Number", "Object", "RegExp", "String"

在JavaScript代码中,唯一可以访问该属性的方法就是通过默认的toString()方法,通常是这样调用的:

Object.prototype.toString.call(value)

可能返回的值有:

  • "[object Undefined]":如果值是undefined,
  • "[object Null]":如果值是null,
  • "[object " + value.[[Class]] + "]":如果值是一个对象.
  • "[object " + value.[[Class]] + "]":如果值是一个原始值(它会被转换成对应的包装类型,从而返回和上面相同的结果).

例子:

> Object.prototype.toString.call(undefined) 
'[object Undefined]'
> Object.prototype.toString.call(Math)
'[object Math]'
> Object.prototype.toString.call({})
'[object Object]'

因此,下面的函数可以用来获取到任意值x的[[Class]]属性:

function getClass(x) {
var str = Object.prototype.toString.call(x);
return /^\[object (.*)\]$/.exec(str)[1];
}

运行上面的函数:

> getClass(null) 
'Null' 

> getClass({}) 
'Object' 

> getClass([])
'Array' 

> getClass(JSON) 
'JSON' 

> (function () { return getClass(arguments) }())    //译者注:ES3环境下会返回"Object",ES5下才是"Arguments"
'Arguments' 

> function Foo() {} 
> getClass(new Foo()) 
'Object' 

typeof

typeof可以用来判断原始值的类型,以及区分对象值和原始值.语法如下:

typeof value

它会返回下面表1中的某个字符串:

表1. typeof返回的值

操作数类型
返回值
undefined
"undefined"
null
"object"
布尔值
"boolean"
数字
"number"
字符串
"string"
函数
"function"
其他
"object"

typeof在操作null时会返回"object",这是JavaScript语言本身的bug.不幸的是,永远不可能被修复了,因为太多已有的代码已经依赖了这样的表现.还需要注意的是,函数也是object类型,但typeof区分了它们.可数组却没有区分,也被视为object.所有的这些怪异表现让判断一个值的类型是否是object变的复杂:

function isObject(x) { 
return x !== null && (typeof x === 'object' || typeof x === 'function');
}

instanceof

instanceof可以检测一个值是否是某个构造函数的实例:

value instanceof Type

该运算符会检查Type.prototype是否处于值value的原型链上.也就是说,如果你自己实现一个instanceof函数,可以像下面这样(没有进行参数的类型检测,比如参数Type为null的情况下会出错):

function myInstanceof(value, Type) { 
return Type.prototype.isPrototypeOf(value);
}

如果是原始值,instanceof总会返回false:

> "" instanceof String 
false
> "" instanceof Object
false

Array.isArray()

Array.isArray()之所以存在,是因为在浏览器中:每个框架都有自己的全局运行环境.例如:框架A和框架B(无论谁包含谁),框架A中的代码可以向框架B中的代码传值.但框架B中的代码不能使用instanceof Array来检测框架A中传来的这个值是否是数组.因为B中的构造函数Array和A中的Array是不同的:

<html>

<head>
<script>
// test()是从iframe中调用的 function test(arr) {
var iframeWin = frames[0];
console.log(arr
instanceof Array); // false console.log(arr instanceof iframeWin.Array); // true console.log(Array.isArray(arr)); // true }
</script>
</head>

<body>
<iframe></iframe>
<script>
// iframe中执行父窗口中的函数 var iframeWin = frames[0];
iframeWin.document.write(
'<script>window.parent.test([])</' + 'script>');
</script>
</body>

</html>

因此, ECMAScript 5才引入了Array.isArray(),它使用了内部属性[[Class]]来判断一个值是否是数组.可是,上面讲的问题不只针对与数组,其他的类型同样也有这个问题,但我们没有Function.isFunction()等等.

内置原型对象

内置类型的原型对象是很特殊的值: 它们的行为很像是该类型的实例,但如果用instanceof检测的话,得出的结果是它们不是该类型的实例.其他的一些用来判断类型的方法也同样有问题.如果搞清楚了这是为什么,你就能更加深入的理解相关知识.

Object.prototype

Object.prototype是一个空对象:它没有任何可迭代的自身属性:

> Object.prototype 
{}
> Object.keys(Object.prototype)
[]

意想不到的.Object.prototype是一个对象,但它却不是Object的实例.一方面,typeof和[[Class]]都将它判断为一个对象:

> getClass(Object.prototype) 
'Object'
> typeof Object.prototype
'object'

另一方面,instanceof不认为它是Object的实例:

> Object.prototype instanceof Object
false

这是因为,如果上面的表达式结果为true,则意味着Object.prototype会存在于自身的原型链中,这样会导致一个原型链的死循环.原型链不再是线性的了,这种数据结构是无法遍历的.因此,Object.prototype没有原型(译者注:也可以说,有原型,但值是null).它也是唯一一个内置的没有原型的对象(译者注:Object.creat(null)也可以创建没有原型的对象).

> Object.getPrototypeOf(Object.prototype) 
null

类似的悖论也适用于所有其他的内置原型对象中:它们在大部分判断手段下都会被判断为是自身类型的实例,但唯独instanceof不是.

能预料到的. [[Class]],typeof和instanceof在其他大部分对象上的判断结果都比较一致:

> getClass({}) 
'Object'
> typeof {}
'object'
> {} instanceof Object
true

Function.prototype

Function.prototype 也是一个函数.它可以接受任何参数,但总是返回undefined:

> Function.prototype("a", "b", 1, 2) 
undefined

意想不到的. Function.prototype是一个函数,但却不是Function的实例:一方面,typeof(通过检测一个对象是否有[[Call]]内部属性来判断它是否是函数)Function.prototype是一个函数:

> typeof Function.prototype 
'function'

[[Class]]内部属性也一样:

> getClass(Function.prototype) 
'Function'

但另一方面,instanceof说Function.prototype不是Function的实例.

> Function.prototype instanceof Function 
false

这是因为Function.prototype的原型链中没有它自身.它的上一级原型是Object.prototype(译者注:和Object一样,必须这么规定,否则原型链会有死循环):

> Object.getPrototypeOf(Function.prototype) === Object.prototype 
true

能预料到的. 其他所有的函数,都没有特殊的表现:

> typeof function () {} 
'function'
> getClass(function () {})
'Function'
> function () {} instanceof Function
true

构造函数Function也被认为是函数:

> typeof Function 
'function'
> getClass(Function)
'Function'
> Function instanceof Function
true

Array.prototype

Array.prototype是一个空数组:

> Array.prototype 
[]
> Array.prototype.length
0

[[Class]]内部属性也判断它为数组:

> getClass(Array.prototype) 
'Array'

Array.isArray()也同样,因为它本来就是基于[[Class]]实现的:

> Array.isArray(Array.prototype) 
true

但是, instanceof不行:

> Array.prototype instanceof Array 
false

为了减少重复语句,在文章剩余下部分中,我不会再提到"原型对象不是自身类型的实例"了.

RegExp.prototype

RegExp.prototype是一个可以匹配任意字符串的正则:

> RegExp.prototype.test("abc") 
true
> RegExp.prototype.test("")
true

[[Class]]的值为"RegExp"

> getClass(/abc/) 
'RegExp'
> getClass(RegExp.prototype)
'RegExp'

附加知识:空正则. RegExp.prototype是一个"空正则".还有两种方式可以创建这样的正则:

new RegExp("")    // 构造函数
/(?:)/ // 字面量

如果你需要动态的创建一个正则表达式(译者注:利用变量中存储的字符串),则你必须使用RegExp构造函数.如果想通过字面量创建一个空正则//是不可行的,因为//会被解析成为注释的开始.一个空的非捕获分组(?:)可以作为一个空正则:它能匹配任意的字符串且不会在匹配过程中创建捕获分组:

> new RegExp("").exec("abc") 
[
'', index: 0, input: 'abc' ]
> /(?:)/.exec("abc")
[
'', index: 0, input: 'abc' ]

一个空的捕获分组的匹配结果会在索引为0的位置包含完整的匹配字符串,也会在索引为1的位置包含第一个捕获分组的值:

> /()/.exec("abc") 
[
'', // index 0 '', // index 1 index: 0,
input:
'abc' ]

有趣的是,通过构造函数创建的空正则RegExp.prototype其实都是一个空的非捕获分组:

> new RegExp("")
/(?:)/
> RegExp.prototype
/(?:)/

Date.prototype

Date.prototype也是一个Date对象:

> getClass(new Date()) 
'Date'
> getClass(Date.prototype)
'Date'

Date对象包装的是一个数字.引用自ECMAScript 5.1规范:

一个Date对象包含了一个数字,该数字表示了一个特定时间点的时间,单位为毫秒.这个数字称之为时间值.一个时间值也以是NaN,表明这个Date对象不表示一个特定时间点的时间.

ECMAScript中的时间是用从协调世界时1970年1月1日开始的毫秒数来表示的.

两种常用的获取时间值的方法是通过调用其valueOf方法或者将该日期对象强制转换为数字:

> var d = new Date(); // 现在的时间 

> d.valueOf() 
1347035199049
> Number(d)
1347035199049

Date.prototype中的时间值是NaN:

> Date.prototype.valueOf() 
NaN
> Number(Date.prototype)
NaN

Date.prototype是一个非法日期,相当于是向构造函数传入NaN时创建的日期对象:

> Date.prototype 
Invalid Date
> new Date(NaN)
Invalid Date

Number.prototype

Number.prototype大致上与new Number(0)相同:

> Number.prototype.valueOf() 
0

将它转换为数字会返回其包装的原始值:

> +Number.prototype
0

和下面的比较一下:

> +new Number(0) 
0

String.prototype

类似的,String.prototype大致上于new String("")相同:

> String.prototype.valueOf() 
''

将它转换为字符串会返回其包装的原始值:

> "" + String.prototype 
''

和下面的比较一下:

> "" + new String("") 
''

Boolean.prototype

Boolean.prototype大致上于new Boolean(false)相同:

> Boolean.prototype.valueOf()
false

Boolean对象可以被强制转换成一个原始布尔值,但转换的结果始终为true,因为所有的对象值转换成布尔值都是true.

> !!Boolean.prototype 
true
> !!new Boolean(false)
true
> !!new Boolean(true)
true

这和对象转换为数字和字符串的表现不同.如果一个对象包装了数字或字符串类型的原始值,转换的结果就是那些被包装的原始值.

建议

下面是针对在JavaScript中如何判断一个值的类型的建议.

将原型对象看作是其类型的原始成员

原型对象总是其类型的原始成员吗?不是的,只有内置类型是这样的.更有用的想法是把它们看成是模拟类的东西:它们的属性会被所有的实例继承(通常是方法).

使用哪种分类机制

在考虑使用哪种分类机制的时候,你要先想想需要处理的值是否可能来自其他框架.

如果没这个可能的话,则使用typeof和instanceof,没必要使用[[Class]]和Array.isArray().但你必须熟悉typeof的怪异表现:null被认为是一个"object"以及存在两个非原始值的类型"object"和"function".例如,下面是一个用来判断是否是对象值的函数.

function isObject(v) {
return (typeof v === "object" && v !== null) || typeof v === "function";
}

尝试使用这个方法:

> isObject({}) 
true
> isObject([])
true

> isObject("")
false
> isObject(undefined)
false

如果你写的代码可能接受来自其他框架的值,那么instanceof并不适合.你必须考虑使用[[Class]]或者Array.isArray().另一个替代办法是使用一个对象的constructor属性的值,但这并不是一个靠得住的解决方案,因为并不是所有的对象都记录着自己的构造函数,也并不是所有的构造函数都有名字,另外还有命名冲突的风险.下面的函数演示了如何获取一个对象的构造函数的名字:

function getConstructorName(obj) {
if (obj.constructor && obj.constructor.name) {
return obj.constructor.name;
}
else {
return "";
}
}

另一个需要指出的是:函数的name属性(比如obj.constructor.name)并不是标准的一部分,例如IE就不支持.尝试运行一下:

> getConstructorName({}) 
'Object'
> getConstructorName([])
'Array'
> getConstructorName(/abc/)
'RegExp'

> function Foo() {}
> getConstructorName(new Foo())
'Foo'

如果将一个原始值传给getConstructorName(),你会得到该原始值对应的包装类型:

> getConstructorName("") 
'String'

这是因为原始值从临时生成的包装对象上获取到了constructor属性:

> "".constructor === String.prototype.constructor 
true

接下来该学习什么

通过本文,你已经学习了如何在JavaScript中判断一个值的类型.但不幸的是,你必须非常了解这部分知识的细节才能很好的完成这项任务,因为有两个相关的运算符是有缺陷的:typeof的奇怪表现(比如在操作null时返回"object")以及instanceof不能识别其他框架中的对象.本文也讲了如何处理这种缺陷.

接下来,你可以开始学习更多关于JavaScript继承的知识.下面的四篇文章可以助你启程:

posted @ 2012-10-11 15:24  紫云飞  阅读(6341)  评论(6编辑  收藏  举报