面向对象设计与构造第一单元总结

写在前面

带着一些惶恐与期待，终于迎来了学长口中“难顶”的OO课程。在暑假3次pre学习经验的加持下，我还是算比较顺利地完成了第一单元的三次作业。虽然分数并不出彩，但是这三次作业还是让我学到了很多东西，感触良多。正好借着这次机会，与大家分享一下我的思考历程。

第一单元主要围绕表达式的求导、结果的长度优化以及表达式的格式检查展开。通过“表达式-项-因子”的关系，让我们更加清晰的认识对象之间的关系，加深面向对象的思想。

下面我将分析每次作业的题目以及相关代码，展示我的实现方式。如果思路存在偏颇，请多多包涵，不吝赐教。

第一次作业

第一次作业的内容相对容易，是实现简单的多项式求导，相关的定义如下：

表达式 → 空白项 [加减空白项] 项空白项 | 表达式加减空白项项空白项
项 → [加减空白项] 因子 | 项空白项 * 空白项因子
因子 → 变量因子 | 常数因子
变量因子 → 幂函数
常数因子 → 带符号的整数
幂函数 → x [空白项指数]
指数 → ** 空白项带符号的整数
带符号的整数 → [加减] 允许前导零的整数
允许前导零的整数 → (0|1|2|…|9)
空白项 →
空白字符 →（空格）| \t
加减 → + | -

(其中{}表示0个、1个或多个，[]表示0个或1个，|表示多个之中选择)

阅读完题目，我们可以清晰地看出一个表达式中存在的简单关系：表达式由项通过正负号连接构成，每一项都由单个因子或者多个因子相乘产生，因子则有常数因子与幂函数两个种类。

程序架构与实现方法

通过上述分析，我们可以比较轻松的得出需要建立的类：主类(MainClass)、表达式类(Polynomial)、项类(Item)、因子类(Factor)。

程序的UML图

整个程序的架构还是相对简明清晰的，各个类之间的关系并不复杂，没有出现高耦合的问题。

需要注意的是，我们在建立类的时候，要兼顾后续可能存在的迭代开发。例如：幂函数的底数可以换成其他函数或者多项式，变量因子后续可能不只有幂函数存在......

笔者第一次作业建立类的时候，就缺少了这样的考虑，这直接导致了第二次作业的重构，希望读者以此为鉴。

主类(MainClass)

主类中不涉及字符串的处理，仅用来读入字符串并输出运算结果。

表达式类(Polynomial)

在表达式类中，我建立了两个ArrayList用来存放表达式拆出来的项以及项求导后的结果。Polynomial()方法通过正则表达式匹配项，再调用differentiate()方法对其求导。此外，新建一个simplify()方法来化简合并求导后的结果。

项类(Item)

Item类继承了Comparable接口，可以通过系数进行排序，主要目的是输出求导结果时，让可能存在的正项优先输出，减少开头加负号带来的不必要的长度增加。读入每一项内容，通过正则表达式匹配拆出因子，传入因子类中。

因子类(Factor)

因子类是我这次作业比较欠缺考虑的类。因为第一次作业只有常数因子与幂函数，我就没有建立对应的常数类和幂函数类，而是直接在Factor类中进行判断、存储：

这里我通过是否含有x来判断因子的类型（这样很不好），再进行存储。存储时我做了一个简单的抽象：

Factor -> coeff * x ** index

无论常数因子还是幂函数都可以这样存储，可以选择存为一个二元对，也可以在因子类中建立coeff与index两个成员来存放。

结果化简

这次由于函数类型较少，只要别无脑toString()，对求导结果进行保存并合并，就可以得到很不错的性能分了。另外，x**2其实可以输出为x*x，这样长度又可以减少啦。

注意！！！x*x的表述在后续作业中存在风险！！！

程序结构的度量分析

类度量分析

图表显示，Polynomial类的圈复杂度过高，主要原因是求导方法存在多层循环嵌套，造成性能的降低。

方法度量分析

求导方法的处理不是很完美，耦合度太高，圈复杂度更高。正确做法应该是在每个类中完成求导，在上一级的类中调用求导函数得到结果。但是第一次作业较为简单，我也就没有考虑那么多。(后果是第二次作业女娲补天orz)

度量分析小结

分析完代码，自己担心的问题果然发生了(当时偷懒写的求导函数明显是面向过程的，写完就觉得不对劲)。这份代码的求导问题没有得到很完美地解决，如果不把求导下放到下一级的类中，带来的复杂度增加是无法解决的。此外，存储数据的方式不限于ArrayList，使用其他存储类型也可以降低复杂度(比如HashMap)。当然，这次作业也存在优点，对表达式的解析过程十分清晰，类与类的关系简明。

程序bug分析

这次作业很幸运，没有出现bug。我在课下与另一位同学(@qlh)合作完成了一个简单的评测机，通过大量数据测试，证明了程序的可靠性与正确性，也为后续的互测准备了工具。

互测寻找bug的策略

首先要对题目给出的形式化表述有明确的认知，特别要关注同级(项、因子)之间的连接处可能存在的问题。例如，正负号出现的次数与位置，空格可能出错的位置以及简化表述-x可能存在的问题。

此外，可以自己尝试搭建一个评测系统：利用python或者java的xeger模块，根据所给的正则表达式随机生成表达式；将别人或自己的程序求导结果，与python自带的sympy库求导后的结果进行对比，发现存在的问题。

第二次作业

第二次作业在上一次的基础上加入了正余弦函数与表达式因子：

因子 → 变量因子 | 常数因子 | 表达式因子
变量因子 → 幂函数 | 三角函数
表达式因子 → '(' 表达式 ')'
三角函数 → sin 空白项 '(' 空白项 x 空白项 ')' [空白项指数] | cos 空白项 '(' 空白项 x 空白项 ')' [空白项指数]

一开始读完题目，我是绝望的 T ^ T......题目对因子做了增加，这表示我第一次作业拆分因子的方式将会完全无效，再三考虑之后，我选择了重构。题目中，表达式因子的出现，使得通过正则表达式拆分项与因子不再可行，因此我们不得不选择其他方法处理表达式串。一种可行的方法是递归下降分析，笔者尝试过使用该方法，但无奈看不太懂网上的教程，最终选择了一种类似递归下降的方法。