数据结构实践——“求两集合交集”的一个错解分析

  本文点评一位学生对基于线性表存储集合,然后对集合进行求并运算的错解,供学习者參考。

【项目 - 求集合并集】
  如果有两个集合 A 和 B 分别用两个线性表 LA 和 LB 表示,即线性表中的数据元素即为集合中的成员。设计算法。用函数unionList(List LA, List LB, List &LC )函数实现该算法,求一个新的集合C=A∪B。即将两个集合的并集放在线性表LC中。

提示:
(1)除了实现unnionList函数外。还须要在main函数中设计代码,调用unionList进行測试和演示;
(2)能够充分利用前面建好的算法库[点击…]。在程序头部直接加 #include<list.h>就可以(project中最普遍的方法,建议採纳);
(3)也能够将实现算法中须要的线性表的基本运算相应的函数,与自己设计的全部程序放在同一个文件里。

点这儿…】能够看课程中提供參考解答。

【错解】

#include <stdio.h>
#include "list.h"

void unionList(SqList *LA, SqList *LB, SqList *&LC)
{
    int e;
    int lena=LA->length;
    LC = LA;
    for (int i = 0; i <LA->length; i++)
    {
        if (LA->data[i] != LB->data[i])
        {
            ListInsert(LC, lena++, LB->data[i]);
        }
    }
    DispList(LC);
}

int main()
{
    SqList *la, *lb, *lc;
    ElemType x[2] = {1,2};
    ElemType y[2] = {1,4,3}; //原文中仅仅有{1,4}。为更好地反映问题,我添加1个元素3
    ElemType z[4];
    CreateList(la, x, 2);
    CreateList(lb, y, 3);
    CreateList(lc, z, 4);
    unionList(la, lb, lc);
    return 0;
}

【我的点评】
  阅读代码知道,第8行LC=LA,意即从此LC指向的也就是LA指向的线性表了。对比题目要求。合并后的LC应该是一个新的线性表。此处处理不合要求。


  若不考虑这一要求,LC=LA后。合并的结果就保存在LA(也是LC)中了。

在内存訪问的机制中,这是合法的。(这儿和内存管理中的什么堆区、栈区之类的没有关系。内存管理机制对于计算机类的学生非常重要。但一般入门级阶段并不讲。)合法仅是在合乎语法要求的层面,其实,LC原先指向的空间从此没有由不论什么变量指向,也没有被释放,成了“游离”的垃圾。  
  接下来的讨论。我们就以合并后的结果保存到LA中为起点。
  第9-15行的处理,能够看出学生在算法设计时没有理清头绪。LA(LC)中已经是并集中的第一部分元素了,接下来。应该是“将LB中有,但LA没有的元素,加到LC中”(严格讲,“LB中的元素”指LB指针指向的线性表代表的集合中的元素,LA、LC同),代码没有体现出这层意思。

为了完毕这一任务,要考察LB中的每个元素。最外层的循环,应该针对的是LB,而不是LA。


  故算法框架应该是:

    for (i = 0; i <LB->length; i++)
    {
        //若LB集合中的第i个元素不在原LA集合中。则将LB中的第i个元素添加到LC中
    }

  怎样知道“LB集合中的第i个元素不在原LA集合中”?这须要和LA集合中的元素逐个比較的!

于是这里须要针对“原LA集合”构造一个循环,以便逐个比較。显然。11-14行的一个分支结构,仅完毕“LA和LB同样序号的元素是否相等”,是不足以考察LA中的每个元素的。于是上面是算法框架拓展为:

    for (i = 0; i <LB->length; i++)
    {
        for (j = 0; j <lena; j++)  
            //若LB->data[i] == LA->data[j]退出循环
        //循环中未出现相等的情形。则说明LB->data[i]未在LA中出现过,要将LB->data[i]添加

    }

  于是,尽可能在原错误程序基础上改动,且合并后的结果LC实际就是LA的情况下,得到的完整代码为:

#include <stdio.h>
#include "list.h"

void unionList(SqList *LA, SqList *LB, SqList *&LC)
{
    int i,j;
    int lena,lenc;
    lena=lenc=LA->length; //lena是原LA长度。lenc代表合并后的长度
    LC = LA;  //LC和LA将指同一个集合
    for (i = 0; i < LB->length; i++)
    {
        for (j = 0; j <lena; j++)
            if(LB->data[i] == LA->data[j])
                break;
        if(j>=lena)  //退出前面的循环是由于全找过了找不着,即在原LA中不存在
        {
            ListInsert(LC, ++lenc, LB->data[i]);
        }
    }
}

int main()
{
    SqList *la, *lb, *lc;
    ElemType x[2] = {1,2};
    ElemType y[3] = {1,4,3}; //原文中仅仅有{1,4},为更好地反映问题,我添加1个元素3
    //ElemType z[4];
    CreateList(la, x, 2);
    CreateList(lb, y, 3);
    //CreateList(lc, z, 4);
    unionList(la, lb, lc);
    DispList(lc);
    return 0;
}

  须要强调的是,for (j = 0; j <lena; j++)中的lena是“原LA”的长度。不能用LA->length取代,由于在LA、LC混用的情况下,LA->length随着插入,是动态变化着的。


  在原參考解答中,“插入LB中每个元素”仅仅用了一重循环,但要知道,实现if (!LocateElem(LA,e))的内部,“藏”对LA指向的每个元素的扫描,是内含一层循环的,到算法库[点击…]中考察基本操作的实现能够验证这一说法。这种写法看起来更简单,也道出了我们应该用基本运算为单位进行思考的必要性。这是在学习数据结构中,应该养成的习惯。这是project中用到的思维,代码写得出,还要写得好。
  在上面的解答中,我将DispList(LC);放到main函数中了。

unionList仅仅管合并,无论别的不论什么事情。这是软件project中“高内聚”的要求——一个模块尽可能仅仅完毕单一的工作。“显示结果”是“求并”以后做的工作,两者是“平级”的。不要将显示作为合并的一部分。
  还有,新代码中的27和30(在原代码中也有)没有必要,这样创建了线性表,却在合并时直接将LC和LA共用空间了,何必呢,反倒使一块空间彻底成了垃圾。


  在刚開始学习的人的学习中,一定要争取自己写出来。能够參考一切能够用到的资料启示自己,给出自己的解答。写出这种错解。也是好的成果,中间的思考、尝试过程是我们真正要的东西。这个过程价值连城。当自己已经经过一定的思考之后,再看一些相对规范的解法(比如本文中的參考解答)。也是非常必要的。

观摩、阅读是学习方法。如果能在观摩中品到其味道,再去仿制一份。也便极好。

posted @ 2017-06-15 20:30  mfmdaoyou  阅读(971)  评论(0编辑  收藏  举报