软件工程革命三部曲 —— 软件工程

摘要

相信在博客园，大部分是工程师，而不是科学家。

阅读完本文，您将了解基于RBAC的权限理论、数据挖掘的核心理论、.net的设计思想等。软件工程的核心本质。

同时，本文是软件工程革命的三部曲系列之一，当第三部结束后（预计10年底），您将能领会到我提出的，尚未有人涉足的一个新的工程革命！

原始的开发与工程级别的开发

原始开发模式：

我一个人开发了一个MIS系统，部署到客户端。客户提出需求，我直接在源代码上修改编译，然后提着USB，或者直接传个package过去升级。如果我有需要修改代码，也是直接在代码上修改，然后编译，发布。

可是如果我面对着10个顾客，很快就会力不从心，有时候改了，自己以为所有影响都考虑到了，可是部署到了客户端，第二天就打电话来说启动不了。然后只好亲自去客户现场一个个修改。（亲身体会）

工程模式：

每次修改代码的时候，首先写一份分析报告，包括需要修改的代码部分，修改的目的，受影响的其他依赖DLL文件。

（省略N步的开发、回归测试、功能测试）

结束后，传到实验室的测试机进行稳定性测试。一般要进行3天到一个星期。实验环境和客户环境是一致的。然后再部署到客户端。

对比：

明显工程级别的开发烦琐很多，而且“不用脑”的更多了，我们胸前带着光荣的“software engineer” （软件工程师），表示我们干的东西就越不用脑子，越机械。

所以，我就得到了工程的核心思想。

工程的思想

核心思想是：在万变中寻找不变，并不用思考的服从。

无论是开发软件过程、还是开百货连锁店、还是任何大规模的项目，必定符合工程的思想，就是尽可能的不用脑子。

无论任何与工程相关的技术，也是体现了一点：让操作者更加的愚蠢。只有这样，才能实现工程的目标。

所以，问题就来到了 与工程相关的技术 这一点上了。

与工程相关的技术包括什么？例如ORM框架、持久层框架、金色海洋的自然框架、 hibernate、spring、基于角色的权限系统（RBAC）、数据挖掘（不包括分析）、甚至.net平台也是工程的产物，而不是科学的产物！

现在就让我一个个去分析这些工程技术的本质共同点。

RBAC权限理论 —— Role based Access Control

博客园上吵的最厉害的，无非就是数据访问和权限。

首先您的权限框架无论用什么死人技术、无论多么的方便甚至吹的天花乱坠，您的技术必定要提供一个功能：

根据当前登录的用户名（username），是否拥有对应的资源编号（ResourceID），如果有，表示能操作、如果没有、表示没有权限。

在很早的ACT理论里面，提供了一个访问控制列表。简单的模型，就是设定了每一个用户对应的资源列表。然后判断权限的时候去查看这个列表是否包含了资源编号。

User <------> ResourceID

可是伟大的工程师们发现，这个USER非常不稳定，小张今天是科长，明天是处长；小李今天在庶务二科，明天就到了庶务三科。这样变得经常修改权限列表。怎么解决？您动动脚趾头就想到了，添加一个中间层去隔离变动。于是出现了RBAC

User <------> Role <-------> ResourceId

调整之后，由于Role/Resource之间的变化是很小的，剩下的变化就存在了user/role之中，瞬间就解决了50%的工作量。

权限系统无论怎么设计，无非就是：根据具体的行业添加不同的中间表。例如角色表、科室表、部门表、上下级表等等等等。

Datamining ——数据挖掘的核心思想

一项技术不过瘾，我再解释下数据挖掘。

首先我先列举一些让这个技术与外行人隔离的术语。

OLAP / ETL / 数据仓库 / 事实表 Fact Table / 维度表 Dimention Table 。。。

首先，假设数据库的销售数据表是

POS_SALESRECEIPT
{
MERCHANTCODE //商家编码
MERCHANTNAME //商家名称
SHOPCODE //门店编码
SHOPNAME //门店名称

ITEMCODE //商品编码

ITEMNAME //商品名称

SALESQTY //销售数量

SALESPRICE //销售价格

CREATEDATE //创建日期

}

让我们回想下，如果要查询销售数据怎么查？写SQL贝。例如

A. 查询时间段内的销售记录，不就是

SELECT SUM(SALEPRICE) FROM POS_SALESRECEIPT WHERE CREATEDATE > :DATEFROM ...

B. 查询某门店的销售记录，不就是

SELECT SUM(SALEPRICE) FROM POS_SALESRECEIPT WHERE SHOPCODE = :SHOPCODE ...

如果门店有地区的区分，则使用JOIN去链接地区的表，然后修改一下查询条件。剩下的例子就不举了。

可是伟大的工程师们又发现，这些销售记录往往是百万千万级别的，但是查询条件是百、千级别的。如果每次查询都需要遍历整个销售数据表，就太慢了。而且当业务发生变化，例如国内企业变成了国际企业，则销售数据需要添加国家的字段等等。

怎么办？让我们在动动脚趾头吧！添加中间表，然后加外键！

首先我们把销售表拆分成以下（先拆3张吧）：

POS_SALESRECEIPT ---- DM_SHOP（门店表） ---- DM_MERCHANT（供应商表） ---- DM_DATETIME（时间表）

---- DM_ITEM（商品表）

然后对应的表结构变成：

POS_SALESRECEIPT

{

SALESQTY //销售数量

SALESPRICE //销售价格

DM_SHOP_PKCODE //外键指向门店表

DM_MERCHANT_PKCODE //外键指向供应商表

DM_DATETIME_PKCODE //外键指向时间表

DM_ITEM_PKCODE //外键指向商品表

}

DM_DATETIME

{

PKCODE //主键

ORIGDATETIME //原销售时间

DATEOFWEEK //销售时间的周

DATEOFMONTH //销售时间的月

DATEOFYEAR //销售时间的年

}

DM_SHOP

{

PKCODE //主键

SHOPNAME //门店名称

LOCATIONNAME //地址名称

DISTRICTNAME //区域名称

COUNTRYNAME //国家名称

}

（剩下的表结构就不列举了，反正就是简单的拆分）

现在我们查询，首先是搜索拆分的表，然后通过JOIN链接的销售表，就可以获得销售数据，例如

A. 查询时间段内的销售记录

SELECT SUM(POS_SALESRECEIPT.SALEPRICE) FROM POS_SALESRECEIPT INNER JOIN DM_DATETIME ON POS_SALESRECEIPT.DM_DATETIME_PKCODE = DM_DATETIME.PKCODE WHERE DM_DATETIME .XXXXX

最多加几个GROUP BY（貌似SQL的诞生就是为数据挖掘服务的。。）

怎么样，现在觉得够简单了吧。这个就是数据挖掘。。。MY GOD....

所谓的ETL，即使如何从一张原始销售数据表拆分成为多张表。

所谓OLAP，就是如何去用一些（助记符）更加方便的拼SQL

所谓FACT TABLE（事实表）就是POS_SALESRECEIPT，DIMENTION TABLE（维度表）就是DM_DATETIME ...

.NET的精髓

工程技术可以一直讲下去，其本质不过就是那些，咱们动动脚趾头也能想到的。篇幅有限，我先转战到.NET的设计。

.NET最漂亮的地方是：无耻的抄袭了JAVA的“中间语言”Java Bytecode思想，形成了自己的一套IL，即所谓的MIL。其他什么F#, C#, 动态、反射等等都是小儿科。

估计各位看到这里，会有一种醍醐灌顶的感觉，没错，这就是工程的核心思想。

计算机硬件不同，那么执行的指令一定不同，不同的操作系统支持的指令也不一样。如果要针对不同的硬件、平台去写不同的代码，估计大多数人会崩溃的。

于是伟大的工程师又出来露露脸了。无论计算机的硬件如何设计，必然遵循着一定的规律，比如寄存器、堆栈等等，那么通过引入中间层IL，让IL映射到目标代码（这部是非常简单的），然后我们的业务逻辑再映射到IL，是不是工作量就减少了50%？所以为啥IL长的有点像汇编之类的就是这个道理。

后续与下集预告

其实对于技术进步，我实在想不明白为什么会这么慢。例如.net，竟然要2k年前后才出现，而电脑在195x年就有了。不知道那些伟大的工程师们什么时候还会再出来露露脸。

下篇，我会针对现在软件工程中一个薄弱环节提出自己的工程化理论，并且分析。这项环节相信大多数人都会经历并且无可奈何。不是做不到，而是很多人没有去“工程化”。

咱们下回再见！（也许是几个月后）希望您保持关注！鄙视我的人请点击推荐！支持我的人请点击推荐！反正只有推荐。哈哈哈！

posted @ 2010-02-01 01:09 辰阅读(2252) 评论(12) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

美丽人生

凤凰