【译】Javascript中的数据类型

    这篇文章通过四种方式获取Javascript中的数据类型:通过隐藏的内置[[Class]]属性;通过typeof运算符;通过instanceof运算符;通过函数Array.isArray().我们也会看看原型对象的构造函数,可能会有意想不到的数据类型结果。

    [这篇文章是我在adobe发布的文章,我发布在这里只是为了存档。]

  1. 知识储备

    在开始我们的话题之前,我们不得不复习一些所需的知识点 

    1.1 原始值和对象

    Javascript中的数据,要么是原始值,要么是对象。

    原始值。下面是原始值:

  • undefined
  • null
  • Booleans
  • Numbers
  • Strings

    原始值是不变的,你不能给它们添加属性:

> var str = "abc";
> str.foo = 123;  // try to add property "foo”   
123 
> str.foo  // no change
undefined    

    原始值是通过数值进行比较的,如果它们有相同的内容就认为相等。

> ‘abc’ === ‘abc’
true

    对象。所有非原始值都是对象。对象是可变的:     

> var obj = {};
> obj.foo = 123;  // try to add property “foo” 
123
> obj.foo  // property "foo" has been added 
123  

    对象是通过引用进行比较的。每一个对象都有各自的特性,两个对象只有是同一个对象,才会被认为是相等的。

> {} === {}
false
> var obj = {};
> obj === obj
true

    对象封装类型。基本数据类型boolean、number和string都有各自对应的Boolean Number String对象封装类型。与原始值不同,后者都是对象的实例。它们的封装形式是:

> typeof new String("abc")
'object'
> typeof "abc"
'string'
> new String("abc") === "abc"
false

    对象封装类型很少被直接使用,但是它们的原型对象定义了原始值的方法。如:String.prototype是封装类型String的原型对象。它所有的方法对string也可用,原始值同样拥有String.prototype.indexOf,并不是不同的方法使用相同的名称,相同的方法是:

> String.prototype.indexOf === "".indexOf
true

    1.2 内部属性

    Javascript中内部属性不能直接访问,但是它影响程序的运行。内部属性的名称以大写字母开始,并且写在双层方括号中。如:[[Extensible]]是一个布尔型的标志,决定对象是否可以扩展属性。它的值可以通过Object.isEntensible()间接的获取它的值,Object.preventExtensions()可以设置它的值为false。一旦变成false之后,就无法再变成true了。

    1.3 术语:原型和原型对象

    在Javascript中,原型拥有多重含义:

    1. 一方面,是原型对象之间的关系。每一个对象都有一个隐藏属性[[Porototype]],指向它的原型对象或者是null。对象的原型是一个延续,如果一个属性无法在对象中找到,可以追溯到它的原型上查找。多个对象可以有相同的对象。

    2. 另一方面,如果一个类型是由构造函数Foo实现的,那么这个构造函数有一个原型对象Foo.prototype,保存类型的原型对象。

    为了很好的区分,我们写了关于原型(1)和原型对象(2)的例子。三种方法帮助我们处理原型:

  • Object.getPrototypeOf(obj),返回obj的原型:
> Object.getPrototypeOf({}) === Object.prototype
true
  • Object.create(proto),新建一个原型是proto的空对象。
> Object.create(Object.prototype)
{}

        Object.create()可以做的更多,但是超出了这篇文章的范围。

  • proto.isPrototypeOf(obj),如果proto是obj的原型(或者是obj原型的原型),返回true
> Object.prototype.isPrototypeOf({})
 true

    1.4 constructor属性 

    实现一个构造函数Foo,它的原型Foo.prototype拥有一个属性Foo.prototype.constructor指向构造函数Foo。每个函数都有自动设置这个属性。    

> function Foo() { }
> Foo.prototype.constructor === Foo
true
> RegExp.prototype.constructor === RegExp
true

    所有构造函数的实例,继承原型对象上的所有属性,我们可以确定一个实例的构造函数。

> new Foo().constructor
[Function: Foo]
> /abc/.constructor
[Function: RegExp] 

    2. 数据的类型

    我们可以通过四种方式获取数据类型:

  • [[Class]]是一个内部属性字符串,用来给对象分类
  • typeof是一个运算符,用来区分对象和原始值
  • instance of是一个运算符,用来分类对象
  • Array.isArray()是一个区分数值和数组的函数

    2.1 [[Class]]

    [[Class]]是一个内部属性,它的值有: 

    "Arguments", "Array", "Boolean", "Date", "Error", "Function", "JSON", "Math", "Number", "Object", RegExp", “String"

    Javascript只能通过toString()方法(Object.prototype.toString())获取。这个方法是通用的,返回:

  • "[object Undefined]" 如果值是undefined,
  • "[object Null]" 如果值是null,
  • "[object " + obj.[[Class]] + "]" 如果是一个对象obj.
  • 原始值转化为对象可以按照上面的规则处理

  如:

> Object.prototype.toString.call(undefined)
'[object Undefined]'
> Object.prototype.toString.call(Math)
'[object Math]'
> Object.prototype.toString.call({})
'[object Object]’

 

    因此,下面的函数返回[[Class]]的值是x 

function getClass(x) {
    var str = Object.prototype.toString.call(x);
    return /^\[object (.*)\]$/.exec(str)[1];

}

    下面是一些应用: 

> getClass(null)
'Null'

> getClass({})
'Object'

> getClass([])
'Array'

> getClass(JSON)
'JSON'

> (function () { return getClass(arguments) }())
'Arguments'

> function Foo() {}
> getClass(new Foo())
‘Object'

    2.2 typeof

    typeof对原始值进行分类,可以帮助我们区分原始值和对象。

        typeof value

    下面是一些值和结果的对照关系:

 

结果

undefined

“undeifined"

null

“object"

Boolean

“boolean"

Number

“number"

String

“string"

Function

“function"

其他值

“object"

    typeof null返回object是一个bug,但是不能修复,因为它会破坏现在存在的代码。注意,function也是一个对象,但是typeof做了区分,Array也是一个对象。

    2.3 instanceof

    instanceof检测值是不是一个构造函数的实例:

        value instanceof Type

    这个操作符看起来像Type.prototype,检测原型链是否有value。如果我们自己实现的话,就像下面这个样子(会有一些错误,比如说null):

function myInstanceof(value, Type) {
        return Type.prototype.isPrototypeOf(value);
}

    原始值使用instanceof都会返回false

> "" instanceof String
false
> "" instanceof Object
false

    2.4 Array.isArray()

    Array.isArray()这个方法存在是因为浏览器的一个特殊的问题:每一个frame都有一个自己的运行环境。如:现在存在frame A和frame B(每一都有自己的document)。通过frame A 传递参数给frame B,frame B中不能通过instanceof判断,传递的参数是不是array。因为frame A中的Array和frame B中Array(array是它的一个实例)并不是同一个。 

<html>
<head>
    <script>
        // test() is called from the iframe
        function test(arr) {
            var iframeWin = frames[0];
            console.log(arr instanceof Array); // false
            console.log(arr instanceof iframeWin.Array); // true
            console.log(Array.isArray(arr)); // true
        }
    </script>
</head>
<body>
    <iframe></iframe>
    <script>
        // Fill the iframe
        var iframeWin = frames[0];
        iframeWin.document.write(
            '<script>window.parent.test([])</'+'script>');
    </script>
</body>
</html>

    因此,ES5中Array.isArray()使用[[Class]]来检查一个值是不是数组。它的意图是使JSON.stringify()更安全,instanceof的问题存在于各个类型中

    3. 内置的原型对象

    原型对象的内置类型是奇怪的值:他们都是原始的值,而不是实例。这就导致分类很诡异。为了摸清这个诡异的现象,我们需要深入理解分类。

    3.1 Object.prototype

    Object.prototype看起来更像是一个空对象:不存在任何可以枚举的属性(它的所有方法都是不可枚举的)。

> Object.prototype
{}
> Object.keys(Object.prototype)
[]

    Object.prototype是一个对象,但是不是Object函数的实例。一方面,通过typeof和[[Class]]得到它是一个对象。 

> getClass(Object.prototype)
'Object'
> typeof Object.prototype
‘object'

    另一方面,instanceof不认为它是Object的实例。    

> Object.prototype instanceof Object
false

    为了让上面的结果变成true,Object.prototype必须在它的原型链上,这样就会原型链上形成一个死循环。这就是为什么Object.prototype没有prototype属性了,它是唯一一个内置对象。

 > Object.getPrototypeOf(Object.prototype)
null

    这是所有内置对象的一个悖论:它算是实例类型但不是instanceof。

     [[Class]], typeof and instanceof 在其他对象上是适用的:

> getClass({})
'Object'
> typeof {}
'object'
> {} instanceof Object
true

    3.2 Function.prototype

    Function.prototype是它的函数本身,接受任何的参数都返回undefined:

> Function.prototype("a", "b", 1, 2)
undefined

    Function.prototype是一个函数,但是不是Function的实例: 一方面, typeof Function.prototype的结果是一个函数:    

> typeof Function.prototype
'function' 

    通过内部属性[[Class]]结果也一样:

> getClass(Function.prototype)
'Function'

    另一方面, instanceof表明Function.prototype不是Function实例。

> Function.prototype instanceof Function
false

    这就是为什么Function.prototype没有存在它的原型链上. 相反, 它的原型是Object.prototype:     

> Object.getPrototypeOf(Function.prototype) === Object.prototype
true  

    其他函数没有什么特别的:

> typeof function () {}
'function'
> getClass(function () {})
'Function'
> function () {} instanceof Function
true

    任何场景下,Function还是Function

> typeof Function
'function'
> getClass(Function)
'Function'
> Function instanceof Function
true    

    3.3 Array.prototype

    Array.prototype是一个空数组:它的长度是0.

> Array.prototype
[]
> Array.prototype.length
0

    [[Class]]也认为它是array:

> getClass(Array.prototype)
 ‘Array'

    Array.isArray()也是这样的,因为它是基于[[Class]]实现的:

> Array.isArray(Array.prototype)
 true

    自然而然,instanceof不是这样的:

> Array.prototype instanceof Array
false

    在这个章节我们不会提醒y原型对象不是他们构造函数的实例。

    3.4 RegExp.prototype

    RegExp.prototype是一个匹配任何东西的正则表达式:

> RegExp.prototype.test("abc")
true
> RegExp.prototype.test("")
true

    RegExp.prototype也可以使用String.prototype.match通过[[Class]],检测参数是不是一个正则表达式. 检测结果如下: 

> getClass(/abc/)
'RegExp'
> getClass(RegExp.prototype)
'RegExp'

    空的正则表达式. RegExp.prototype和“空正则表达式”相等。 可以通过一下两种方式实现: 

new RegExp("")  // constructor 构造函数
 /(?:)/          // literal 字面量

    如果你想动态的生成一个正则表达式,只能通过构造函数才能创建。通过字面量的方式创建一个空的正则表达式,如: // 是不能直接使用的。应该是用(?:)空的非捕捉分组来实现空的正则表达式。    

> new RegExp("").exec("abc")
[ '', index: 0, input: 'abc' ]
> /(?:)/.exec("abc")
[ '', index: 0, input: 'abc' ]

    比较发现,空的分组不仅可以完成匹配,并且可以捕捉分组一中:

> /()/.exec("abc")
[ '',  // index 0
  '',  // index 1
  index: 0,
  input: 'abc’ ]

    有意思的是,空正则表达式不管是构造函数形式的还是RegExp.prototype形式的,它们最终的展现结果都是字面量: 

> new RegExp("")
/(?:)/
> RegExp.prototype
/(?:)/

    3.5 Date.prototype

Date.prototype也是date类型:
> getClass(new Date())
'Date'
> getClass(Date.prototype)
'Date'  

    日期是数字. 在ES5.1中的描述是这样的:    

A Date object contains a Number indicating a particular instant in time to within a millisecond. Such a Number is called a time value. A time value may also be NaN, indicating that the Date object does not represent a specific instant of time.

 Time is measured in ECMAScript in milliseconds since 01 January, 1970 UTC.

    两种方式可以获取日期的时间戳,一种是通过调用valueof()方法,一种是调用Number函数:

> var d = new Date(); // now

> d.valueOf()
1347035199049
> Number(d)
1347035199049

    Date.prototype的时间戳是NaN:

> Date.prototype.valueOf()
NaN
> Number(Date.prototype)
NaN 

    Date.prototype是一个非法的日期, 好像是同过NAN创建的一样:     

> Date.prototype
Invalid Date
> new Date(NaN)
Invalid Date

    3.6 Number.prototype

    Number.prototype的值和new Number(0)是一样的: 

> Number.prototype.valueOf()
0

转换成数字的话,返回基本数据类型:

> +Number.prototype
0

比较:

> +new Number(0)

0

  

  3.7 String.prototype

  String.prototype和new String("")的值是一样的:

> String.prototype.valueOf()
''

转化为字符串的话,返回基本数据类型:

> "" + String.prototype
''

比较:

> "" + new String("")
''

    3.8 Boolean.prototype

    Boolean.prototype和new Boolean(false)的值是一样的:

> Boolean.prototype.valueOf()
false

    布尔对象可以转化为布尔值,但是所有的结果都是true,因为对象转换成布尔值都是true。     

> !!Boolean.prototype
true
> !!new Boolean(false)
true
> !!new Boolean(true)
true

    这个对象转化成数字或者字符串不同:如果对象封装了原始值,那么转换结果就是封装的原始值。

    译者注:比如我使用Object实例化一个数字,我会这么操作:

> new Object(1);
Number {[[PrimitiveValue]]: 1}
//这就是上面所有的,被封装过的原始值

    4. 推荐

    本节给出了很多建议,怎么能最好的区分Javascript中的数据类型。

    4.1 把原型对象作为原始类型的成员

    一个原型对象总是一个原始类型的成员吗?不,这仅仅适用于内置的类型。一般而言,原型对象的行为很神奇,最好是把它们作为模拟类:它们包含所有实例共享的属性(通常方法)。

    4.2 使用哪个分类机制

    当决定如何最好的使用Javascript中分类机制,必须区分正常的代码和不同frame的代码。

    普通代码:在普通代码中,使用typeof或者instanceof,而不是[[Class]]和Array.isArray()。你必须清楚的知道typeof的特殊结果:null的结果是object,有两个非原始值的分类:function和object。如判断一个函数是不是一个对象可以通过下面的方式:

function isObject(v) {
    return (typeof v === "object" && v !== null)

        || typeof v === "function";

}

    尝试:

> isObject({})
true
> isObject([])
true
> isObject("")
false
> isObject(undefined)
false

   代码跨frame传递:如果接收其他frame传递的值,那么使用instanceof就不再可用了,必须考虑使用[[Class]]或者是Array.isArray()。另外一个选择就是获得构造函数名,但是这个也不是很靠谱:不是所有的对象都有构造函数,也不是所有的构造函数都有名称。下面是如何获得构造函数的名称: 

function getConstructorName(obj) {
    if (obj.constructor && obj.constructor.name) {
        return obj.constructor.name;
    } else {
        return "";
    }
}

    另外需要指出的是,函数的name属性(obj.constructor)不是一个标准,如:IE浏览器就不支持。

    尝试:

> getConstructorName({})
'Object'
> getConstructorName([])
'Array'
> getConstructorName(/abc/)
'RegExp'
> function Foo() {}
> getConstructorName(new Foo())
'Foo'

    如果对原始值使用getConstructorName方法的话,它的值是该类型对应的构造函数:

 > getConstructorName("")
'String'

    那是因为原始值获取了原型对象上的constructor属性:   

 > "".constructor === String.prototype.constructor
true

    5. 下一步读些什么

    通过这篇文章知道Javascript中,怎么对数据进行分类。不幸的是,为了能够正确的执行,需要了解一些详细的知识。作为两个主要的分类是有缺陷的:typeof null是object,instanceof不能跨frame。文章也介绍了解决缺陷的建议。

    下一步,需要进一步了解Javascript的继承,下面的四篇博客可以作为入门:

 

原文地址:http://www.2ality.com/2013/01/categorizing-values.html

posted @ 2015-06-14 14:02  黑MAO  阅读(1240)  评论(2编辑  收藏  举报