概述数据结构和算法

数据结构+算法

什么是计算机科学

  • 首先明确的一点就是计算机科学不仅仅是对计算机的研究,虽然计算机在科学发展的过程中发挥了重大的作用,但是它只是一个工具,一个没有灵魂的工具而已。所谓的计算机科学实际上是对问题、解决问题以及解决问题的过程中产生产生的解决方案的研究。例如给定一个问题,计算机科学家的目标是开发一个算法来处理该问题,最终得到该问题的解、或者最优解。所以说计算机科学也可以被认为是对算法的研究。因此我们也可以感受到,所谓的算法就是对问题进行处理且求解的一种实现思路或者思想。

如何形象化的理解算法

  • 一个常胜将军在作战之前都会进行战略的制定,目的是为了能够在最短的时间切成本消耗最低的情况下获取最终的胜利。如果将编码作为战场,则程序员就是这场战役的指挥官,你如何可以将你的程序可以在最短且消耗资源最小的情况下获取最终的执行结果呢?算法就是我们的策略!

意义

  • 数据结构和算法思想的通用性异常的强大,在任何语言中都被使用,它们将会是我们编码生涯中伴随我们最长久利器(左膀右臂)。有一定经验的程序员最终拼的就是算法和数据结构。
  • 数据结构和算法思想也可以帮助我们拓展和历练编码的思维,可以让我们更好的融入到编程世界的角角落落。

什么是算法分析

  • 刚接触编程的学生经常会将自己编写的程序和别人的程序做比对,获取在比对的过程中会发现双方编写的程序很相似但又各不相同。那么就会出现一个有趣的现象:两组程序都是用来解决同一个问题的,但是两组程序看起来又各不相同,那么哪一组程序更好呢?
  • a+b+c = 1000 a2 + b2 = c**2 (a,b,c均为自然数),求出a,b,c可能的组合?
# 方式1:
for a in range(1001):
    for b in range(1001):
        for c in range(1001):
            if a + b + c == 1000 and a**2 + b**2 = c**2:
                print(a, b, c)
# 方式2:
for a in range(1001):
    for b in range(1001):
        c = 1000 - a - b
        if a + b + c == 1000 and a**2 + b**2 = c**2:
            print(a, b, c)

以上两种方式都是正确的, 但是若是实际使用还是会选择效率更高的方式.两种方法同时执行后, 会发现第一种方式会消耗非常多的时间, 所以会选择第二种方式. 现在就要涉及到评判程序优劣的方法

评判程序优劣的方法

  • 消耗计算机资源和执行效率(无法直观)
  • 计算算法执行的耗时(不推荐,因为会受机器和执行环境的影响)
  • 时间复杂度(推荐)

时间复杂度

  • 评判规则:量化算法执行的操作/执行步骤的数量
  • 最重要的项:时间复杂度表达式中最有意义的项
  • 使用大O记法来表示时间复杂度
    • O(最重要的项)
    • 如何识别最重要的项
# 我们按照每次执行都算一次io的操作当成一步
def sumOfN(n):
    theSum = 0 ---> 1步
    for i in range(1,n+1): ---> 1步
        theSum = theSum + i ---> 一共循环了n次所以循环体执行了n次

    return theSum

print(sumOfN(10))
# 所以函数体中一共执行了n+2  ==>O(n)
  • 案例:计算下列算法的时间复杂度
a=5
b=6
c=10
for i in range(n):
   for j in range(n):
      x = i * i
      y = j * j
      z = i * j
for k in range(n):
   w = a*k + 45
   v = b*b
d = 33

#3+3n**2+2n+1 ==>n**2==>O(n**2)
  • 常见的时间复杂度:
    • O(1) < O(logn) < O(n) < O(nlogn) < O(n^2) < O(n^3) < O(2^n) < O(n!) < O(n^n)

数据结构

  • 概念:对于数据(基本类型的数据(int,float,char))的组织方式就被称作为数据结构。数据结构解决的就是一组数据如何进行保存,保存形式是怎样的。

  • 案例: 需要存储一些学生的学生信息(name,score),那么这些数据应该如何组织呢?查询某一个具体学生的时间复杂度是什么呢?(三种组织方式)

方式1:
[{
    'name':'xxx',
    'score':'xxx'
},{
    'name':'xxx',
    'score':'xxx'
},{
    'name':'xxx',
    'score':'xxx'
}]
方式2:
[
    ('name','score'),
    ('name','score'),
    ('name','score')
]
方式3:
{
    'zhangsan':{'score':'xxx'},
    'lisi':{'score':'xxx'}
}

从以上的讲解中我们可以计算O(n)方式可以计算出第三种方法执行步骤最少, 是最好的储存方式

  • 使用不同的形式组织数据,在基于查询时的时间复杂度是不一样的。因此认为算法是为了解决实际问题而设计的,数据结构是算法需要处理问题的载体。

实操

  • 在列表的操作有一个非常常见的编程任务就是是增加一个列表。我们马上想到的有两种方法可以创建更长的列表,可以使用 append 方法或拼接运算符。但是这两种方法那种效率更高呢。这对你来说很重要,因为它可以帮助你通过选择合适的工具来提高你自己的程序的效率。

  • 实例化一个空列表,然后将0-n范围的数据添加到列表中。(四种方式)

def test01():
    alist = []
    for i in range(1000):
        alist += i
    return alist
def test02():
    alist = []
    for i in range(1000):
        alist.append(i)
    return alist
def test03():
    return [i for i in range(1000)]
def test04():
    alist = list(range(1000))
    return alist
  • 前面我们说过评判程序好坏的最方便和高效方法是时间复杂度, 但是一个程序判断要严谨, 我们应该计算的是平均时间, 这时候我们就遇到了一个难题, 程序的执行次数必须保证一定的次数, 我们不可能一次次的手动执行并记录, 最后计算时间. 这种方式非常消耗人力物力, 这样一次次的计算不如直接选一种方式随便用. 这时候我们就需要用到timeit模块

timeit模块

  • timeit模块:该模块可以用来测试一段python代码的执行速度/时长。

  • Timer类:该类是timeit模块中专门用于测量python代码的执行速度/时长的。原型为:class timeit.Timer(stmt='pass',setup='pass')。

    • stmt参数:表示即将进行测试的代码块语句。
    • setup:运行代码块语句时所需要的设置。
    • timeit函数:timeit.Timer.timeit(number=100000),该函数返回代码块语句执行number次的平均耗时。
  • 示例

from timeit import Timer

def sumdef1():
    alist = []
    for i in range(1000):
        alist += [i]
        return alist


def sumdef2():
    alist = []
    for i in range(1000):
        alist.append(i)
        return alist


def sumdef3():
    alist = [i for i in range(1000)]
    return alist


def sumdef4():
    alist = str(range(1000))
    return alist

if __name__ == '__main__':
    timer = Timer('sumdef1()', 'from __main__ import sumdef1')
    t1 = timer.timeit(10000)
    print(t1)

    timer = Timer('sumdef2()', 'from __main__ import sumdef2')
    t2 = timer.timeit(10000)
    print(t2)

    timer = Timer('sumdef3()', 'from __main__ import sumdef3')
    t3 = timer.timeit(10000)
    print(t3)

    timer = Timer('sumdef4()', 'from __main__ import sumdef4')
    t4 = timer.timeit(10000)
    print(t4)
  • 四种方式中哪种方式添加列表元素的效率最高呢?
    • 计算运行平均耗时
posted @ 2019-11-28 21:57  5魁首啊666  阅读(137)  评论(0)    收藏  举报