数据结构实践——“求两集合交集”的一个错解分析

　　本文点评一位学生对基于线性表存储集合，然后对集合进行求并运算的错解，供学习者參考。

【项目 - 求集合并集】
　　如果有两个集合 A 和 B 分别用两个线性表 LA 和 LB 表示，即线性表中的数据元素即为集合中的成员。设计算法。用函数unionList(List LA, List LB, List &LC )函数实现该算法，求一个新的集合C=A∪B。即将两个集合的并集放在线性表LC中。

提示：
（1）除了实现unnionList函数外。还须要在main函数中设计代码，调用unionList进行測试和演示；
（2）能够充分利用前面建好的算法库[点击…]。在程序头部直接加 #include<list.h>就可以（project中最普遍的方法，建议採纳）；
（3）也能够将实现算法中须要的线性表的基本运算相应的函数，与自己设计的全部程序放在同一个文件里。

【点这儿…】能够看课程中提供參考解答。

【错解】

#include <stdio.h>
#include "list.h"

void unionList(SqList *LA, SqList *LB, SqList *&LC)
{
    int e;
    int lena=LA->length;
    LC = LA;
    for (int i = 0; i <LA->length; i++)
    {
        if (LA->data[i] != LB->data[i])
        {
            ListInsert(LC, lena++, LB->data[i]);
        }
    }
    DispList(LC);
}

int main()
{
    SqList *la, *lb, *lc;
    ElemType x[2] = {1,2};
    ElemType y[2] = {1,4,3}; //原文中仅仅有{1,4}。为更好地反映问题，我添加1个元素3
    ElemType z[4];
    CreateList(la, x, 2);
    CreateList(lb, y, 3);
    CreateList(lc, z, 4);
    unionList(la, lb, lc);
    return 0;
}

【我的点评】
　　阅读代码知道，第8行LC=LA，意即从此LC指向的也就是LA指向的线性表了。对比题目要求。合并后的LC应该是一个新的线性表。此处处理不合要求。

　　若不考虑这一要求，LC=LA后。合并的结果就保存在LA（也是LC）中了。

在内存訪问的机制中，这是合法的。（这儿和内存管理中的什么堆区、栈区之类的没有关系。内存管理机制对于计算机类的学生非常重要。但一般入门级阶段并不讲。）合法仅是在合乎语法要求的层面，其实，LC原先指向的空间从此没有由不论什么变量指向，也没有被释放，成了“游离”的垃圾。　　
　　接下来的讨论。我们就以合并后的结果保存到LA中为起点。
　　第9-15行的处理，能够看出学生在算法设计时没有理清头绪。LA（LC）中已经是并集中的第一部分元素了，接下来。应该是“将LB中有，但LA没有的元素，加到LC中”（严格讲，“LB中的元素”指LB指针指向的线性表代表的集合中的元素，LA、LC同），代码没有体现出这层意思。

为了完毕这一任务，要考察LB中的每个元素。最外层的循环，应该针对的是LB，而不是LA。

　　故算法框架应该是：

    for (i = 0; i <LB->length; i++)
    {
        //若LB集合中的第i个元素不在原LA集合中。则将LB中的第i个元素添加到LC中
    }

　　怎样知道“LB集合中的第i个元素不在原LA集合中”？这须要和LA集合中的元素逐个比較的！

于是这里须要针对“原LA集合”构造一个循环，以便逐个比較。显然。11-14行的一个分支结构，仅完毕“LA和LB同样序号的元素是否相等”，是不足以考察LA中的每个元素的。于是上面是算法框架拓展为：

    for (i = 0; i <LB->length; i++)
    {
        for (j = 0; j <lena; j++)  
            //若LB->data[i] == LA->data[j]退出循环
        //循环中未出现相等的情形。则说明LB->data[i]未在LA中出现过，要将LB->data[i]添加

    }

　　于是，尽可能在原错误程序基础上改动，且合并后的结果LC实际就是LA的情况下，得到的完整代码为：

#include <stdio.h>
#include "list.h"

void unionList(SqList *LA, SqList *LB, SqList *&LC)
{
    int i,j;
    int lena,lenc;
    lena=lenc=LA->length;　//lena是原LA长度。lenc代表合并后的长度
    LC = LA;  //LC和LA将指同一个集合
    for (i = 0; i < LB->length; i++)
    {
        for (j = 0; j <lena; j++)
            if(LB->data[i] == LA->data[j])
                break;
        if(j>=lena)  //退出前面的循环是由于全找过了找不着，即在原LA中不存在
        {
            ListInsert(LC, ++lenc, LB->data[i]);
        }
    }
}

int main()
{
    SqList *la, *lb, *lc;
    ElemType x[2] = {1,2};
    ElemType y[3] = {1,4,3}; //原文中仅仅有{1,4}，为更好地反映问题，我添加1个元素3
    //ElemType z[4];
    CreateList(la, x, 2);
    CreateList(lb, y, 3);
    //CreateList(lc, z, 4);
    unionList(la, lb, lc);
    DispList(lc);
    return 0;
}

　　须要强调的是，for (j = 0; j <lena; j++)中的lena是“原LA”的长度。不能用LA->length取代，由于在LA、LC混用的情况下，LA->length随着插入，是动态变化着的。

　　在原參考解答中，“插入LB中每个元素”仅仅用了一重循环，但要知道，实现if (!LocateElem(LA,e))的内部，“藏”对LA指向的每个元素的扫描，是内含一层循环的，到算法库[点击…]中考察基本操作的实现能够验证这一说法。这种写法看起来更简单，也道出了我们应该用基本运算为单位进行思考的必要性。这是在学习数据结构中，应该养成的习惯。这是project中用到的思维，代码写得出，还要写得好。
　　在上面的解答中，我将DispList(LC);放到main函数中了。

unionList仅仅管合并，无论别的不论什么事情。这是软件project中“高内聚”的要求——一个模块尽可能仅仅完毕单一的工作。“显示结果”是“求并”以后做的工作，两者是“平级”的。不要将显示作为合并的一部分。
　　还有，新代码中的27和30（在原代码中也有）没有必要，这样创建了线性表，却在合并时直接将LC和LA共用空间了，何必呢，反倒使一块空间彻底成了垃圾。

　　在刚開始学习的人的学习中，一定要争取自己写出来。能够參考一切能够用到的资料启示自己，给出自己的解答。写出这种错解。也是好的成果，中间的思考、尝试过程是我们真正要的东西。这个过程价值连城。当自己已经经过一定的思考之后，再看一些相对规范的解法（比如本文中的參考解答）。也是非常必要的。

观摩、阅读是学习方法。如果能在观摩中品到其味道，再去仿制一份。也便极好。

posted @ 2017-06-15 20:30 mfmdaoyou 阅读(1040) 评论(0) 收藏举报

刷新页面返回顶部

数据结构实践——“求两集合交集”的一个错解分析

公告