开放平台的安全性考量（上）

前言

开放平台概念由来已久。个人第一次接触开放平台开发是在2004年，使用当时如日中天的eBay API为eBay卖家开发管理工具。后来几年又陆续使用过国外的几家电子商务厂商、SNS社交类网站以及Google提供的开放API。近几年来，国内的开放平台概念越来越热。主要集中在三类网站。一类是社交类。例如人人、开心和各个微博平台。主要是Facebook和Twitter在开放方面取得的巨大成功让这些网站看到了一个可能的方向。另外一类是搜索引擎，主要是百度的框运算。第三类是电子商务，以淘宝的TOP（Taobao Open Platform）为代表。

一家网站可能在一开始就有意识地走开放之路，希望构造一个宏大的生态圈，吸引到更多的第三方开发者和独立软件提供商到这个生态圈中发展，从而形成良性循环。也有可能在一开始只是业务需要，要在组织机构以外做数据交换或者支持客户做二次开发。但是不管目的怎样，开放平台在系统结构上，有很多共同的地方。稳定性、高可用性、性能等ility要素都是在开放平台架构设计时需要考虑的。但是作为面向组织外客户的API开放，安全性（security）却一定是架构师在做Balance时首先和优先考虑的ility属性。

我所工作的网站Active.com主要服务于北美用户。从2009年开始，我们陆续开始了自己的开放之路。目前我们所做的工作还远远称不上“平台”，但是也毕竟在开放这条路上迈出了第一步。作为开放平台的观察者、开发者和设计者，安全一直是我最感兴趣的部分。昨天从北京参加完淘宝2011开放年发布会之后，我一直在想把自己对这一块的思考整理一下，算是对自己学习过程的一个总结回顾。

开放平台的系统角色

一个开放平台架构所针对的系统角色简单来讲有以下几类：

1. 网站提供基础用户和服务的网站
2. 服务网站内部的某个用于完成业务或者提供数据的服务接口。一般根据数据格式有SOAP, XML, JSON等。使用HTTP协议进行访问，因此都是无状态的（Stateless）。
3. 开放平台内部服务通过接入开放平台，实现向外部用户提供服务。平台需要负责完成接收请求，身份校验，权限检查，流量控制，行为监控，服务转发，返回结果等一系列工作，是整个开放平台架构的核心应用。某些“平台”功能相对简单，直接开发独立的专门针对外部用户的服务，这种实际上是把平台和单个服务在物理上合二为一。
4. 第三方应用第三方应用系统通过平台入口，访问到内部服务，从而完成跨企业域的业务整合。比如开发者为新浪微博开发的应用，可以使用自己的域名，独立运行在第三方服务器上，但是依然可以通过远程API调用完成业务功能。
5. 用户用户在此指网站用户，同时他们可能会使用第三方应用访问自己的数据，或者完成其网站业务。在电子商务系统中，用户还需要分为2类，A类用户为业务的提供方，通常需要利用网站和第三方应用向其他用户提供业务；例如淘宝卖家。B类就是业务的接收方，利用网站和第三方应用接收A类用户提供的业务；例如淘宝买家。

开放平台的身份认证体系 (Authentication of Open Platform)

身份认证(Authentication)是开放平台安全体系中的第一道关卡。作为独立的安全主体，开放平台对来自安全边界（Security Boundary）以外的每一次访问请求都需要做独立的身份认证，因为我们这里所谈的开放API都是通过无状态的HTTP协议进行的。

通常我们需要认证两类身份：一类身份是应用身份，一类是用户身份。

针对应用身份的认证一般是通过一个应用票据（App Token or App Key）完成的。这个Token由平台颁发给对应的应用开发者，并由第三方应用进行保管。平台负责该票据的审核生成、发放与生命周期管理。在每次API请求的时候，由第三方应用负责在该次请求中携带该票据，并由开放平台完成票据验证。这个机制中，需要开放平台生成的应用票据具备以下特性以确保安全：

1. 唯一标示。每个Token必须唯一标示一个指定的应用以防止身份冒用。
2. 不可猜测。这个Token的生成必须有随机因子，使得它不可被猜测。例如，使用开发者用户名和时间哈希生成的Token，就是一个不安全的Token.
3. 票据的有效性验证必须基于持久化比对，不能基于算法。尽管持久化票据并且读取比对存在一定的性能问题，但是这个可以依靠Cache予以解决。如果对票据不做持久化，而仅仅依靠算法保证其有效性，那么算法的泄密（通过前员工，逆向工程，代码泄露等）必然导致整个系统再无任何安全性可言。
4. 如有可能，附加验证。很多时候对于应用的身份验证只是基于1个secret确实显得不太安全。因为这意味着一旦App Token泄露，应用身份就有可能被盗用。所以如有可能的情况下，开放平台应对App Token身份认真做附加验证，例如来源IP或者域名。针对来源域名做验证时，不要信任Http头中的Referrer，而应该去检查预设应用域名是否被解析到来源IP地址。因为前者是可以被伪造的。针对分布式应用，考虑采用白名单和地址段的方式会有所帮助。
*5. 时效性。尽管很多开放平台基于方便开发者的考虑，对App Token的时效性没有做过多要求，也就是说永久有效。但是从安全管理的角度，为Token设置一个有效期并且实施过期提醒策略，督促第三方开发者更新App Token，是非常有必要的。过期时间不宜太短，一般12个月左右对大部分开发者来说是可以接受的。
*6. 提供App Token暂时失效能力。供第三方开发者发现身份被盗用后迅速切断API盗用。这个能力作为开放平台的内部管理能力，供平台运维团队处理紧急情况使用。

针对用户身份的认证目前也有很多解决方案。其中oAuth是目前被广泛采用的一个解决思路。基本思路就是由第三方应用将用户重定向至平台的制定页面（在母网站域内），用户在登录后完成授权生成授权Token，然后由平台重定向用户至第三方应用并携带Access Token. 此后的第三方应用就可以凭借Access Token以用户身份访问开放API。oAuth有很多种实现，无论采取哪种方案，在实际实施中，需要注意的安全性问题有：

1. 注意oAuth 1.0是不安全的。其授权过程可被截断并予以伪造（俗称的session fixation攻击）。1.0 A修正了这个问题。当然如果有兴趣的话，可以看看最新的2.0规范。更新版的1.0a和2.0都已经成为RFC标准。实施时不一定严格遵守，但是了解其原理和安全改进是必须的！
2. 注意授权页面的CSRF问题。这个问题很多平台都有过，严重程度不用多说。这也是为什么oAuth标准中一定有一个看似没有用处且影响性能的Request Token。还是那句话，自己实现没有问题，也不一定需要一定严格遵守RFC，但是一定要明白为什么RFC这样设计。
3. 尽量使用Http Header而不是Query String传递参数。
4. 控制时效性。需要结合业务，对重要业务，尽可能地避免长效Token以保护用户。在很多情况下，牺牲用户体验是必须做出的艰难选择。看一看支持本地Cookie免登录的电子商务网站，在下单和支付时又需要再次登录，就能理解这一点了。

oAuth认证针对移动应用和桌面应用意义不是很大。尽管2.0规范中已经为此增加了几种新的Workflow，但是个人认为用户体验都很差。针对这种需求，只能具体问题具体分析，一个建议是，不到万不得已，不要轻易开放支持Http Basic的API。有可能今天这个开发者是非常值得信赖的，但是口子一旦开放，就再也难以回头，只能越来越糟。解决这一问题的思路主要有：

1. PIN码验证。对桌面应用比较有效，参见新浪的实现方式。
2. 移动终端的验证中心应用。由用户在第三方应用上提出授权申请，再在官方应用（或者移动网站）的授权中心进行授权，开放平台在接到授权指令后通过后台推送Access Token到第三方应用接口，完成授权。这种方式对移动终端较为方便。用户体验在可接受的范围之内。
3. 建议开发者不要再开发桌面应用。

开放平台的授权机制（Authorization of Open Platform）

相对于认证（Authentication）来说，授权（Authorization）是一个更为复杂的过程。各种应用之间的用户角色、用户组、权限交叉在一起，看上去很容易让人眼花缭乱迷失方向。作为开放平台的设计者和开发者，需要捋清头绪，分清楚主要矛盾和次要矛盾。

开放平台所需要解决的第一个授权问题，就是某应用究竟是否有权限访问某API。在平台上接入的API，应该根据企业的业务划分，应用的开发者等级，以及实际业务需要，授权给尽可能小的应用群体。也就是所谓的最小化授权。这种授权可以由平台通过简单的对应完成。为了较少维护成本，也可以对应用和API划分不同的安全等级，高等级的应用可以访问的API是低等级应用被授权API的超集。

在实际开发中，我们甚至考虑过由平台做Function粒度的授权控制。但是后来发现这样做成本太高，而且没有必要。让API开发者去做他们该做的事情。平台所需要做的事情，不是提供一个万能的权限管理机制（相信我，这样会死人的，我试过），而是完成自己该做的事情，把正确的访问请求，访问者身份和访问参数，转交给服务提供者。

posted on 2012-05-10 11:27 tianyaxiang 阅读(2396) 评论(0) 收藏举报

刷新页面返回顶部

天涯想