python自动开发之(算法)第二十七天

 

1、什么是算法?

算法(Algorithm):一个计算过程,解决问题的方法

2、复习:递归

递归的两个特点:(1) 调用自身 (2)结束条件

def func1(x):
    print(x)
    func1(x-1)

def func2(x):
    if x>0:
        print(x)
        func2(x+1)


def func3(x):
    if x>0:
        print(x)
        func3(x-1)

def func4(x):
    if x>0:
        func4(x-1)
        print(x)
View Code

func1和func2不是递归

func3和func4是递归,但是结果不一样,func3(5)打印的是5,4,3,2,1 而func4(5)结果是1,2,3,4,5

3、时间复杂度

时间复杂度:用来评估算法运行效率的一个东西

小结:

  时间复杂度是用来估计算法运行时间的一个式子(单位)。

  一般来说,时间复杂度高的算法比复杂度低的算法快。

  常见的时间复杂度(按效率排序)

  O(1)<O(logn)<O(n)<O(nlogn)<O(n^2)<O(nlogn)<O(n^3)

  不常见的时间复杂度(看看就好)

  O(n!) O(2n) O(nn) …

  如何一眼判断时间复杂度?

  循环减半的过程O(logn)

  几次循环就是n的几次方的复杂度

 4、空间复杂度

  空间复杂度:用来评估算法内存占用大小的一个式子

5、列表查找

  列表查找:从列表中查找指定元素

  输入:列表、待查找元素

  输出:元素下标或未查找到元素

6、顺序查找

   从列表第一个元素开始,顺序进行搜索,直到找到为止。

7、二分查找

  从有序列表的候选区data[0:n]开始,通过对待查找的值与候选区中间值的比较,可以使候选区减少一半。

def bin_search(data_set,val):
    '''
    mid:下标
    low:每次循环的列表最左边下标
    high:每次循环的列表最右边下标
    :param data_set:列表
    :param val: 要找的值
    :return:
    '''
    low = 0
    high = len(data_set)-1
    while low <= high:
        mid = (low+high)//2
        if data_set[mid] == val:
            return mid
        elif data_set[mid] > val:
            high = mid - 1
        else:
            low = mid + 1
    return
View Code

8、列表排序

  将无序列表变为有序列表

  应用场景: 各种榜单 各种表格 给二分查找用 给其他算法用

  输入:无序列表

  输出:有序列表

9、排序中比较慢的三种: 冒泡排序 选择排序 插入排序

   快速排序

   排序NB二人组: 堆排序 归并排序

     没什么人用的排序: 基数排序 希尔排序 桶排序

  算法关键点: 有序区 无序区

10、冒泡排序

  首先,列表每两个相邻的数,如果前边的比后边的大,那么交换这两个数

  n = len(list),循环了i趟(i=n-1),第i趟循环比较了(j = n-i-1 )次,j是每趟循环比较的次数 

import random,time

#装饰器
def cal_time(func):
    def wrapper(*args,**kwargs):
        t1 = time.time()
        ret = func(*args,**kwargs)
        t2 = time.time()
        print('time cost: %s \r\nfunc from %s'%(t2-t1,func.__name__))
        return func
    return wrapper

@cal_time
def bubble_sort(li):
    for i in range(len(li) - 1):
        for j in range(len(li) - i - 1):
            #升续
            if li[j] > li[j+1]:
                li[j],li[j+1]=li[j+1],li[j]
            #降续
            # if li[j] < li[j+1]:
            #     li[j],li[j+1]=li[j+1],li[j]



data = list(range(1000))
random.shuffle(data)
print(data)
bubble_sort(data)
print(data)
View Code

  优化后的冒泡排序:

    如果冒泡排序中执行一趟而没有交换,则列表已经是有序状态,可以直接结束算法。

import random,time

#装饰器
def cal_time(func):
    def wrapper(*args,**kwargs):
        t1 = time.time()
        ret = func(*args,**kwargs)
        t2 = time.time()
        print('time cost: %s \r\nfunc from %s'%(t2-t1,func.__name__))
        return func
    return wrapper

@cal_time
def bubble_sort(li):
    for i in range(len(li) - 1):
        exchange = False
        for j in range(len(li) - i - 1):
            #升续
            if li[j] > li[j+1]:
                li[j],li[j+1]=li[j+1],li[j]
                exchange = True
            #降续
            # if li[j] < li[j+1]:
            #     li[j],li[j+1]=li[j+1],li[j]
            #     exchange = True
        #这里是指上一趟,值之间没有发生交换,就退出循环
        if not exchange:
            break


data = list(range(1000))
random.shuffle(data)
print(data)
bubble_sort(data)
print(data)
View Code

11、选择排序

  一趟遍历记录最小的数,放到第一个位置; 再一趟遍历记录剩余列表中最小的数,继续放置;

import random,time

#装饰器
def cal_time(func):
    def wrapper(*args,**kwargs):
        t1 = time.time()
        ret = func(*args,**kwargs)
        t2 = time.time()
        print('time cost: %s --> \nfunc from %s'%(t2-t1,func.__name__))
        return func
    return wrapper

@cal_time
def select_sort(li):
    for i in range(len(li)-1):
        min_loc = i
        for j in range(i+1,len(li)):
            if li[j] < li[min_loc]:
                min_loc = j
        li[i],li[min_loc] = li[min_loc],li[i]
View Code

12、插入排序

def insert_sort(li):
    for i in range(1,len(li)):
        tmp = li[i]
        j = i - 1
        while j >= 0 and tmp < li[j]:
            li[j + 1] = li[j]
            j -= 1
        li[j + 1] = tmp
View Code

13、练习 用冒泡法把打乱的带ID的信息表排序

import random


def random_list(n):
    ids = range(1000,1000+n)
    result = []
    a1 = ["","","","","","",""]
    a2 = ["","","","","","",""]
    a3 = ["","","","","","",""]
    for i in range(n):
        age = random.randint(16,38)
        id = ids[i]
        name = '%s%s%s'%(random.choice(a1),random.choice(a2),random.choice(a3))
        dic = {}
        dic['id'] = id
        dic['姓名'] = name
        dic['年龄'] = age
        result.append(dic)
    return result


def bubble_sort(li):
    for i in range(len(li)-1):
        for j in range(len(li)-i-1):
            if li[j]['id'] > li[j+1]['id']:
                li[j],li[j+1] = li[j+1],li[j]

data1 = random_list(100)
random.shuffle(data1)
print(data1)
bubble_sort(data1)
print(data1)
View Code

14、快速排序:快

  好写的排序算法里最快的

  快的排序算法里最好写的  

     快排思路:

    取一个元素p(第一个元素),使元素p归位;

    列表被p分成两部分,左边都比p小,右边都比p大;

    递归完成排序。

#快排的复杂度是O(nlog(n)),这是一个特殊情况 
#口诀 右手左手一个慢动作,右手左手慢动作重播(递归)
import time,random,copy

def cal_time(func):
    def wrapper(*args,**kwargs):
        t1 = time.time()
        ret = func(*args,**kwargs)
        t2 = time.time()
        print('time cost: %s from %s'%(t2-t1,func.__name__))
        return func
    return wrapper


def quick_sort_x(data,left,right):
    #这里的left和right是定义列表data,最少有两个元素
    if left<right:
        #partition分割函数,mid是放好的元素的下标
        mid = partition(data,left,right)
        #以下类似二分
        quick_sort_x(data,left,mid-1)
        quick_sort_x(data,mid+1,right)

#快排的复杂度是O(nlog(n)),这是一个特殊情况
def partition(data,left,right):
    #获取左边的第一个元素,这里写left不能写零,因为后面需要递归
    tmp = data[left]
    #终止条件为当left和right碰上时,所以左小于右时为while循环的条件(left和right是下标)
    while left < right:
        #循环条件是右边比tmp大,直到找到右边比tmp小的数,停止循环
        while left < right and data[right] >= tmp:
            right -= 1
        #把找到的右边比tmp小的数移到左边空出来的位置
        data[left] = data[right]
        #循环条件是左边比tmp小,继续循环,直到找到左边比tmp大的数,结束循环
        while left < right and data[left] <= tmp:
            left += 1
        #把左边找到的大于tmp的数移到右边空出来的位置
        data[right] = data[left]
    #当左右相等时,就把tmp放到left和right碰到的位置
    data[left] = tmp
    #mid的值和lef或right值相同,return哪个都可以
    #mid = left
    # return mid
    return left

#对递归函数的装饰,需要再封装一层
@cal_time
def quik_sort(data):
    #0及是left,len(data)-1为right
    return quick_sort_x(data,0,len(data)-1)
View Code
import time,random,copy

def cal_time(func):
    def wrapper(*args,**kwargs):
        t1 = time.time()
        ret = func(*args,**kwargs)
        t2 = time.time()
        print('time cost: %s from %s'%(t2-t1,func.__name__))
        return func
    return wrapper


def quick_sort_x(data,left,right):
    #这里的left和right是定义列表data,最少有两个元素
    if left<right:
        #partition分割函数,mid是放好的元素的下标
        mid = partition(data,left,right)
        #以下类似二分
        quick_sort_x(data,left,mid-1)
        quick_sort_x(data,mid+1,right)

#快排的复杂度是O(nlog(n)),这是一个特殊情况
def partition(data,left,right):
    #获取左边的第一个元素,这里写left不能写零,因为后面需要递归
    tmp = data[left]
    #终止条件为当left和right碰上时,所以左小于右时为while循环的条件(left和right是下标)
    while left < right:
        #循环条件是右边比tmp大,直到找到右边比tmp小的数,停止循环
        while left < right and data[right] >= tmp:
            right -= 1
        #把找到的右边比tmp小的数移到左边空出来的位置
        data[left] = data[right]
        #循环条件是左边比tmp小,继续循环,直到找到左边比tmp大的数,结束循环
        while left < right and data[left] <= tmp:
            left += 1
        #把左边找到的大于tmp的数移到右边空出来的位置
        data[right] = data[left]
    #当左右相等时,就把tmp放到left和right碰到的位置
    data[left] = tmp
    #mid的值和lef或right值相同,return哪个都可以
    #mid = left
    # return mid
    return left

#对递归函数的装饰,需要再封装一层
@cal_time
def quik_sort(data):
    #0及是left,len(data)-1为right
    return quick_sort_x(data,0,len(data)-1)

#冒泡排序
@cal_time
def bubble_sort(li):
    for i in range(len(li) - 1):
        exchange = False
        for j in range(len(li) - i - 1):
            #升续
            if li[j] > li[j+1]:
                li[j],li[j+1]=li[j+1],li[j]
                exchange = True
            #降续
            # if li[j] < li[j+1]:
            #     li[j],li[j+1]=li[j+1],li[j]
            #     exchange = True
        #这里是指上一趟,值之间没有发生交换,就退出循环
        if not exchange:
            break

data = list(range(5000))
random.shuffle(data)
#深度拷贝
data1 = copy.deepcopy(data)
data2 = copy.deepcopy(data)

#快排和冒泡的比较
quik_sort(data1)
bubble_sort(data2)
print(data1)
View Code

升续:

降续:

 

排序速度的定义:

 

一般情况下快排比冒泡快,快排有递归深度的问题,如果深度高的话,需要调整。

 15、堆排序

(1)树与二叉树简介

  树是一种数据结构 比如:目录结构

  树是一种可以递归定义的数据结构

  树是由n个节点组成的集合:

    如果n=0,那这是一棵空树;

    如果n>0,那存在1个节点作为树的根节点,其他节点可以分为m个集合,每个集合本身又是一棵树。

  一些概念

    根节点、叶子节点

    树的深度(高度)

    树的度

    孩子节点/父节点 子树

  

(2)二叉树

  二叉树:度不超过2的树(节点最多有两个叉)

   

(3)满二叉树,完全二叉树

 (4)二叉树的存储方式

  链式存储方式

  顺序存储方式(列表)

  

  父节点和左孩子节点的编号下标有什么关系?

  0-1 1-3 2-5 3-7 4-9

  i ~ 2i+1

 

  父节点和右孩子节点的编号下标有什么关系?

  0-2 1-4 2-6 3-8 4-10

  i ~ 2i+2

(5)小结

  二叉树是度不超过2的树

  满二叉树与完全二叉树

  (完全)二叉树可以用列表来存储,通过规律可以从父亲找到孩子或从孩子找到父亲

(6)堆排序

  大根堆:一棵完全二叉树,满足任一节点都比其孩子节点大

  小根堆:一棵完全二叉树,满足任一节点都比其孩子节点小

(7)堆排序过程

  a、建立堆

  b、得到堆顶元素,为最大元素

  c、去掉堆顶,将堆最后一个元素放到堆顶,此时可通过一次调整重新使堆有序。

  d、堆顶元素为第二大元素。

  e、 重复步骤3,直到堆变空。

  

 

posted @ 2017-03-06 23:50 willpower-chen 阅读(...) 评论(...) 编辑 收藏