数据结构与算法之美学习笔记:第四讲

一、复杂度分析的4个概念

// n 表示数组 array 的长度
int find(int[] array, int n, int x) {
  int i = 0;
  int pos = -1;
  for (; i < n; ++i) {
    if (array[i] == x) {
       pos = i;
       break;
    }
  }
  return pos;
}

1.最坏情况时间复杂度:代码在最理想情况下执行的时间复杂度。

  要查找的变量 x 正好是数组的第一个元素

2.最好情况时间复杂度:代码在最坏情况下执行的时间复杂度。

  如果数组中没有要查找的变量 x,我们需要把整个数组都遍历一遍

3.平均时间复杂度:用代码在所有情况下执行的次数的加权平均值表示。

  我们把每种情况下,查找需要遍历的元素个数累加起来,然后再除以n+1,就可以得到需要遍历的元素个数的平均值,即:

我们知道,要查找的变量 x,要么在数组里,要么就不在数组里。这两种情况对应的概率统计起来很麻烦,为了方便你理解
我们假设在数组中与不在数组中的概率都为1/2。另外,要查找的数据出现在 0~n-1 这n个位置的概率与时一样的,为1/n。所以,根据概率乘法法则,要查找的数据出现在 0~n0~n-1 中任意位置的概率就是 1/(2n)。

因此,前面的推导过程中存在的最大问题就是,没有将各种情况发生的概率考虑进去,如果我们把每种情况发生的概率也考虑进来
那么平均时间复杂度的计算过程变成了这样:

这个值就是概率论中的加权平均值,也叫做期望值,所以平均时间复杂度的全程也叫加权平均时间复杂度或者期望时间复杂度

二、均摊时间复杂度:

 平均复杂度只在某些特殊情况下才会用到,而均摊时间复杂度应用场景它比较特殊、更加有限有限

 // array 表示一个长度为 n 的数组
 // 代码中的 array.length 就等于 n
 int[] array = new int[n];
 int count = 0;
 
 void insert(int val) {
    if (count == array.length) {
       int sum = 0;
       for (int i = 0; i < array.length; ++i) {
          sum = sum + array[i];
       }
       array[0] = sum;
       count = 1;
    }

    array[count] = val;
    ++count;
 }

我先来解释一下这段代码

1、这段代码实现了一个往数组中插入数据的功能。
2、当数组满了之后也就是代码中的 count == array.length时,我们用for循环遍历数组求和,并清空数组,将求和之后的sum值放到数组的第一个位置
3、然后再将新的数据插入。但如果数组一开始就有空闲空间,则直接将数据插入数组

最理想的情况下,数组中有空闲的空间,我们只需要将数据插入到数组小表为count的位置就可以了 复杂度为O(1)
最坏的情况下:数组中没有空闲空间;额,我们需要先做一次数组的遍历求和,然后再将数据插入,所以最坏情况时间复杂度为 O(1)

平均时间复杂度是:O(1)

假设数组的长度是 n,根据数据插入的位置的不同,我们可以分为n种情况
每种情况的时间复杂度是 O(1)。除此之外,还有一种“额外”的情况,就是在数组没有空闲空间时插入一个数据,这个时候的时间复杂
度是 O(n)。而且,这 n+1 种情况发生的概率一样都是 1/(n+1)。所以,根据加权平均的计算方法,我们求得得的平均时间复杂度就是:

在代码执行的所有复杂度情况中绝大部分是低级别的复杂度,个别情况是高级别复杂度且发生具有时序关系时,可以将个别高级别复杂度均摊到低级别复杂度上。基本上均摊结果就等于低级别复杂度。

均摊时间复杂度就是一种特殊的平均时间复杂度

三、几个为什么?

1、为什么要引入这4个概念?

1.同一段代码在不同情况下时间复杂度会出现量级差异,为了更全面,更准确的描述代码的时间复杂度,所以引入这4个概念。

2.代码复杂度在不同情况下出现量级差别时才需要区别这四种复杂度。大多数情况下,是不需要区别分析它们的。

2、用生活中的例子解释这四个概念

今天你准备去老王家拜访下,可惜老王的爱人叫他去打个酱油,她告诉你说她限时n分钟🕒给他去买。那么你想着以他家到楼下小卖部来回最多一分钟,

最好的情况

那么 “最好的情况”就是你只用等他一分钟。

最坏的情况:

那么也有可能遇到突发情况,比如说电梯人多吖,路上摔了一胶,天知道他去干了什么,用了n分钟,没办法👐,主上有令,n分钟限时,那这就是“最坏的情况”。

平均时间复杂度:

难点,平均时间复杂度 就是他有可能是第1.2.3...n,中的某个分钟回来,那平均就是1+2+3+...n/n,把所有可能出现的情况的时间复杂度相加除以情况数 。

均摊时间复杂度:

均摊的话就是把花时间多的分给花时间少的,得到一个中间值,所以说这就会和平均混淆,个人觉得主要还是概念不同。假如n是10分钟,那么9分钟分4分钟到1分钟那,8分3给2...,那均摊下来就是5分钟.

3、如何分析平均、均摊时间复杂度?

1.平均时间复杂度

代码在不同情况下复杂度出现量级差别,则用代码所有可能情况下执行次数的加权平均值表示。

2.均摊时间复杂度

两个条件满足时使用:

1)代码在绝大多数情况下是低级别复杂度,只有极少数情况是高级别复杂度;

2)低级别和高级别复杂度出现具有时序规律。均摊结果一般都等于低级别复杂度。

四、课后思考题

1、题目

我们今天学的几个复杂度分析方法,你都掌握了吗?你可以用今天学习的知识,来分析一下下面这个 add() 函数的时间复杂度。

// 全局变量,大小为 10 的数组 array,长度 len,下标 i。
int array[] = new int[10]; 
int len = 10;
int i = 0;

// 往数组中添加一个元素
void add(int element) {
   if (i >= len) { // 数组空间不够了
     // 重新申请一个 2 倍大小的数组空间
     int new_array[] = new int[len*2];
     // 把原来 array 数组中的数据依次 copy 到 new_array
     for (int j = 0; j < len; ++j) {
       new_array[j] = array[j];
     }
     // new_array 复制给 array,array 现在大小就是 2 倍 len 了
     array = new_array;
     len = 2 * len;
   }
   // 将 element 放到下标为 i 的位置,下标 i 加一
   array[i] = element;
   ++i;
}

2、经典留言

1. 最好情况时间复杂度为 O(1)

2.最坏情况分析:

最坏情况代码执行的次数跟每次数组的长度有关
第1次调用insert的执行的次数为 n ,
第2次调用insert的执行的次数为 2n ,
第3次调用insert的执行的次数为 2^2 * n
第k次调用insert的执行的次数为 2^(k-1) * n
最坏时间复杂度为 O(n)。

3. 平均情况分析
当每次遇到最坏情况时数组会进行2倍扩容,原数组被导入新数组,虽然数组的长度变大了,但是插入操作落在的区间的长度是一样的,分别是0~len-1, len~(2len-1),....;
插入的情况仍是len+1种:0~len-1和插满之后的O(len);所以每次插入的概率是:p= 1/len+1,
最后求出加权平均时间复杂度为 1*p + 2*p+ ▪▪▪ + len*p + len * p = O(1) ;

4. 均摊时间复杂度 O(1)

而均摊复杂度由于每次O(len)的出现都跟着len次O(1),是前后连贯的,因而将O(len)平摊到前len次上,得出平摊复杂度是O(1)

3、初学者如何学

报告老师,我好像走错了教室。

我是一个文科转行过来的菜鸟,刚刚学完Python,基本搞懂了“遍历”、“循环”、“判断”等概念。
您开篇讲的课,我都基本都能明白,也提起了兴趣和信心,准备好好跟您学习。但这两次课听完,我又晕菜了。
想请问一下,如果听不太懂(也可以去掉“太”),需要补哪些课?您能告诉我进入您课程的坡道和垫脚石么?有没有稍低一点年级的资料,让我可以补补课呢?
还请抽时间回答,谢谢


1、你说了刚学完python,可能代码还没写熟练,所以我建议把python书上的所有实例代码都自己敲一遍,默写一遍。学编程,光看不写肯定是不行的。

2、等你python代码写熟练了,你可以再开始学我这个专栏。 因为你没有数据结构和算法的基础,所以我建议,配合着《大话数据结构》《算法图解》两本书一块来学习。

3、学习这个专栏的过程中,你可以把我讲到的数据结构和算法都用python代码实现一遍,如果实现不了,可以参照我放在Github上的代码,自己看懂之后,默写一遍。这个步骤非常锻炼你的编程能力,不要忽视!

4、在学习专栏的过程中,不要一觉得看不懂就放弃,师傅领进门,修行靠个人。这里没有葵花宝典一样的捷径。学习还要靠自己。看不懂?那就自己多百度一下,看不懂也可以问问你同学、同事、学长,用一个星期来看一篇文章,狠下心来,别怕麻烦,不会学不会的。

还有很多时候看不懂,你就硬着头皮看,都看完一遍,就会有感觉。之后再等有空了,再来看一遍,慢慢的都懂了。这门课很难,对于初学者来说,应该是计算机里最难的之一了,所以不要期望轻松就学会,这是不现实的。

posted @ 2019-04-30 22:24  活的潇洒80  阅读(359)  评论(0编辑  收藏  举报