posts - 48, comments - 92, trackbacks - 0, articles - 2
  博客园 :: 首页 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理

公告

TypeScript 编译器源码研究(一)

Posted on 2017-11-30 13:50 xuld 阅读(...) 评论(...) 编辑 收藏

TypeScript (以下简称 TS)是一个非常强大的语言,其编译器源码超过 10000 行。

源码在 Github 可以找到:https://github.com/Microsoft/TypeScript/tree/master/src/compiler

基础概念

只读(immutable)对象

TS 源码大量应用了只读对象来提升解析性能。只读对象即一个普通对象,但无法修改其内部任意属性,如果需要修改,则必须创建一个新的副本。

这个设计使得程序可以只在需要的时候再处理对象,并且把处理的结果缓存起来。因为对象是只读的,所以缓存的数据始终是正确的,不会因为对象更改导致缓存失效。

编译器概念

通用的编译器都需要了解以下概念:

  • 语法树(Abstract Syntax Tree):表示源码的基本结构。所有提到编译器原理的地方都会提到语法树,这里不多解释。
  • 符号(Symbol):符号表示是一个变量、一个字段或一个函数之类属于“定义”范畴的概念,符号一般会属于某个词法作用域(Scope),且符号可以计算其类型。
  • 类型(Type):表示一个数值类型,类型拥有父类型、子成员。
  • 流程分支(FlowNode):表示代码从上往下执行的分支情况,通过流程分支可以掌握到从头到当前位置的执行步骤,当然也可以检测到无法执行的代码(比如 return 之后的代码)。
  • 函数签名(Signature):表示一个函数的一种参数方式,通过签名可以确定函数的参数类型和返回类型。一个函数可以有多个签名。

 ---国内研究编译器的人不多,如果你觉得这篇文章有用,请通过评论告知,我将完善内容---