第三单元总结

1.自测过程中测试数据的准备

在本单元中，我主要分两个方面来准备测试数据，一是保证程序正确性的随机生成数据，二是测试程序性能的数据，首先与第二单元不同的是，这部分程序的正确性可以通过对拍来验证，我们要做的就是读懂JML了解数据的范围（边界），再写测试程序来随机生成数据，最后再与同学对拍即可。并且由于有JML的加持，静态对比也是一种发现程序bug的好方式。第二部分就是测试程序性能的数据，这部分尽量要人工构造，而不是随机生成，因为要反复去测那几条时间复杂度比较高的指令，并且生成的关系图也不能是随机的，要保证节点数与边数的比例恰当,接着读出程序开始与结束的时间，保证不超时即可。

2.架构设计、图模型构建和维护策略

2.1架构设计

架构设计按照课程组给出的接口来实现就可以了，不需要自己进行设计。独立于给定接口之外的有几个类，一是Edge边类里面存储的是两个PersonId和他们之间的价值，这个是后面用来维护图用的。并且为了减少行数，我将Kruskal和Dijkstra两个算法单独拿出来，成了两个类，将传入参数设置为他们的构造方法，输出的内容也设置为其中的方法，其余内置的步骤全部设置为private，由此实现了封装。

2.2图模型构建

一个图基本由两部分组成，点集和边集，在这里我将JML中的Person[] people作为点集，用自己构造的ArrayList<Edge> edges作为边集，这样我们就将整个社交网络图建立起来。

2.3维护策略

读了JML语言后，用 ArrayList存储所有数据是我的第一想法，但使用ArrayList的存储效率与查找效率都很低，在第一次作业体现不出来，但在后两次作业中就会造成超时。这是选择HashMap进行存储是一个不错的选择，用id作为key，可以很好的进行查找。所以为了维持基本功能，我们首先要维护的就是HashMap。

接下来第二个要维护的就是我们并查集的father数组，但由于是person的id与id间的对应关系，所以我们仍然选择HashMap来维护这种对应关系。

第三个要维护的就是Kruskal算法中单调递增的边集ArrayList<Edge> edges，我们只需要在每次加入关系后调用一次Collections.sort(edges)即可保证边集是按照value单调递增的。

3.代码实现出现的性能问题和修复情况

3.1第一次作业

在第一次作业中，代码的性能问题主要来自于query_block_sum和query_circle这两条指令，用宽度\深度优先搜索的性能不够好，是十分危险的，最后换成了并查集。网上有很多教程，最终选择了路径压缩加上按秩合并的并查集。

首先要定义两个HashMap来作为我们寻找父亲和存储秩的数组，建立id与id，id与秩的对应关系。

private HashMap<Integer,Integer> fa;
private HashMap<Integer,Integer> rank;

定义查找函数（查找时进行路径压缩）

public int find(int x) {
    if (x == fa.get(x)) {
        return x;
    }
    else {
        fa.put(x,find(fa.get(x)));
        return find(fa.get(x));
    }
}

在加入人时加入相关信息。

public void addPerson(Person person) throws MyEqualPersonIdException {
    fa.put(person.getId(),person.getId());
    rank.put(person.getId(),1);
}

加关系时进行按秩合并

    public void addRelation(int id1, int id2, int value) throws
            MyPersonIdNotFoundException, MyEqualRelationException { 
        int x = find(id1);
        int y = find(id2);
        if (rank.get(x) <= rank.get(y)) {
            fa.put(x,y);
        }
        else {
            fa.put(y,x);
        }
        if ((rank.get(x) == rank.get(y)) && (x != y)) {
            rank.put(y,rank.get(y) + 1);
        }
    }

之后这两条指令便可以简化成为，因为并查集内都是连通的。

    public boolean isCircle(int id1, int id2) throws MyPersonIdNotFoundException {
        if (!contains(id1)) {
            throw new MyPersonIdNotFoundException(id1);
        }
        if (contains(id1) && !contains(id2)) {
            throw new MyPersonIdNotFoundException(id2);
        }
        if (id1 == id2) {
            return true;
        }
        return (find(id1) == find(id2));
    }
    public int queryBlockSum() {
        int sum = 0;
        for (int id : fa.keySet()) {
            if (fa.get(id) == id) {
                sum = sum + 1;
            }
        }
        return sum;
    }

3.2第二次作业

第二次作业出现的性能问题来自于两条指令，query_group_value_sum和query_least_connection。

对于前者，通过用HashMap存储数据再进行查询即可解决。对于后者，我们可以采用并查集优化的Kruskal算法来获得最小生成树，由于并查集我们已经写过了，所以并不是很难完成，NetWork里的大并查集用来判断某个人是否在连通分量中，Kruskal算法中的小并查集用来判断是否成环，具体的算法这里就不再赘述了。

3.3第三次作业

第三次作业的性能问题主要来自send_indirect_message指令，这条指令对应着最短距离算法。纯粹的Dijkstra时间复杂度为$o(n^2)$

这是十分危险的，所以我们采用堆优化的Dijkstra算法，将时间复杂度降至$o(nlogn)$。并且堆优化不需要我们自己写，只需借助PriorityQueue即可完成堆优化。

4.Network扩展

假设出现了几种不同的Person

Advertiser：持续向外发送产品广告
Producer：产品生产商，通过Advertiser来销售产品
Customer：消费者，会关注广告并选择和自己偏好匹配的产品来购买 -- 所谓购买，就是直接通过Advertiser给相应Producer发一个购买消息
Person：吃瓜群众，不发广告，不买东西，不卖东西

如此Network可以支持市场营销，并能查询某种商品的销售额和销售路径等请讨论如何对Network扩展，给出相关接口方法，并选择3个核心业务功能的接口方法撰写JML规格。

首先要定义产品，产品需要有产品种类，产品价格，并且需要在NetWork 中维护一个产品的热度，像emoji那样，在每次发送广告后会使产品热度增加。

   产品属性
   /*@ public instance model int id;
      @ public instance model int price;
      @ public instance model int type;
      @*/
    社交网络中维护的量
    /*@ public instance model non_null Product[] products;
    	@ public instance model non_null Advertisement[] advertisements;
      @ public instance model non_null int[] productTypeList;
      @ public instance model non_null int[] productHeatList;
      @*/

首先定义增加一个产品种类。

	  /*@ public normal_behavior
      @ requires !(\exists int i; 0 <= i && i < productTypeList.length; productTypeList[i] == type);
      @ assignable productTypeList, productHeatList;
      @ ensures (\exists int i; 0 <= i && i < productTypeList.length; productTypeList[i] == type && 
      					productHeatList[i] == 0);
      @ ensures productTypeList.length == \old(productTypeList.length) + 1 &&
      @          productHeatList.length == \old(productHeatList.length) + 1;
      @ ensures (\forall int i; 0 <= i && i < \old(productTypeList.length);
      @          (\exists int j; 0 <= j && j < productTypeList.length; productTypeList[j] == \old(productTypeList[i]) &&
      @          productHeatList[j] == \old(productHeatList[i])));
      @ also
      @ public exceptional_behavior
      @ signals (EqualProductTypeException e) (\exists int i; 0 <= i && i < productTypeList.length;
      @                                     productTypeList[i] == type);
      @*/
      public void storeProductType(int type) throws ProductTypeException;

接着定义增加一个产品

    /*@ public normal_behavior
      @ requires !(\exists int i; 0 <= i && i < products.length; products[i].equals(product)) && 
      					 (containsProductType(product.getProductType()));
      @ assignable products;
      @ ensures products.length == \old(products.length) + 1;
      @ ensures (\forall int i; 0 <= i && i < \old(products.length);
      @          (\exists int j; 0 <= j && j < products.length; products[j] == (\old(products[i]))));
      @ ensures (\exists int i; 0 <= i && i < products.length; products[i] == product);
      @ also
      @ public exceptional_behavior
      @ signals (EqualProductIdException e) (\exists int i; 0 <= i && i < products.length;
      @                                     products[i].equals(product));
      @ also
      @ public exceptional_behavior
      @ signals (ProductTypeNotFoundException e) !(\exists int i; 0 <= i && i < products.length; 		
      	         products[i].equals(product)) && !(containsProductType(product.getProductType()));
      @*/
      public void addProduct(Product product) throws EqualProductIdException, ProductTypeNotFoundException;

最后定义发送广告(让商品热度增加)

    /*@ public normal_behavior
      @ requires (\exists int i; 0 <= i && i < advertisements.length; advertisements[i].getId == id) &&
      					(containsProductType(advertisements[i].getType()));
      @ assignable advertisements, productHeatList;
      @ ensures (\exists int i; 0 <= i && i < productTypeList.length && productTypeList[i] ==
      @			    (\old(getAdvertisement(id))).getType();
      @         productHeatList[i] == \old(productHeatList[i]) + 1);
      @ ensures !containsAdvertisement(id) && advertisements.length == \old(advertisements.length) - 1 &&
      @         (\forall int i; 0 <= i && i < \old(advertisements.length) && \old(advertisements[i].getId()) != id;
      @         (\exists int j; 0 <= j && j < advertisements.length; 
      @					advertisements[j].equals(\old(advertisements[i]))));
      @ also
      @ public exceptional_behavior
      @ signals (AdvertisementIdNotFoundException e) !(\exists int i; 0 <= i && i < advertisements.length;
      @                                     advertisements[i].getId == id);
      @ also
      @ public exceptional_behavior
      @ signals (ProductTypeNotFoundException e) (\exists int i; 0 <= i && i < advertisements.length; 		
      	         advertisements[i].getId == id) && !(containsProductType(advertisements[i].getType()));
      @*/
      public void sendAdvertisement(int id) throws
            AdvertisementIdNotFoundException, ProductTypeNotFoundException;

5.心得体会

本单元让我了解了契约式编程的思想，对日后的学习工作有很大的帮助，并且在自己实现的过程中体会到了实现JML的过程中，可以按照JML的说发来，但是性能不一定好，简单来说就是做出来非常容易但做好难。并且也体会到了JML语言的严谨性，可以将所有逻辑都概括全面。
本单元的难点主要在优化性能上，这也是在图论学习以来第一次尝试使用堆或者并查集来优化算法。让我复习了这部分有关知识，提高了算法能力。
同时实现JML的过程中也让我感到灵活变通是十分重要的，如果一味的按照JML语言来维护数据结构会造成严重的性能下降。

posted @ 2022-06-05 15:00 i7水一阅读(36) 评论(1) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

第三单元总结

第三单元总结

1.自测过程中测试数据的准备

2.架构设计、图模型构建和维护策略

2.1架构设计

2.2图模型构建

2.3维护策略

3.代码实现出现的性能问题和修复情况

3.1第一次作业

3.2第二次作业

3.3第三次作业

4.Network扩展

5.心得体会

公告