算法-排序

算法之各种排序

本节内容

  1. 系统内置排序
  2. 冒泡排序
  3. 冒泡排序改进 双向排序
  4. 插入排序
  5. 希尔排序
  6. 归并排序
  7. 快速排序

1.系统内置排序

在python中使用内置方法对列表进行排序可以使用两种方法:

一种是列表提供的sort方法,该方法的特性是在原址进行排序,没有生成新的列表。

还有一种是python提供的内置方法sorted(),该方法接受一个序列,并返回一个排序好的序列,这种方式没有改变原序列的排序。

这里测试,使用的是list提供的sort内置方法。也就是原址排序。

在上面所列举的排序方式中,list内置方法排序所用时间是最短的,说明性能是最好的,至于其内部实现方式,需要看源码才能明白。

下面是列表内置方法排序的源代码:list。sort()

 

2.冒泡排序

冒泡排序原理:从左到右先找第一个值,然后拿这个值右边的值和它进行比较,假如右边的值比它小,那就将右边的这个值和它进行交换, 这样,就能够将整个列表中最小的值放到最左边,第一次排序完成,之后对第二个数也进行相同的操作,最终整个列表变成有序的。

冒泡排序法的时间复杂度是O(n**2),是一种稳定排序算法,逻辑比较简单。

冒泡排序算法的源代码:

def MaoPaoSort(List):
    for i in range(0, len(List) - 1):
        for j in range(i + 1, len(List)):
            if List[i] > List[j]:
                List[i], List[j] = List[j], List[i]
    return List

3.冒泡排序改进 双向排序

冒泡双向排序的原理:冒泡排序的改进其实就是在对第一个值寻找最小值的同时也在对最后一个值寻找最大值,双向寻找,这样,一次排序下来,能得到左右两边两个排好序的值,这样,总的执行排序的次数将减少一半。

但是,在python中,双向排序的使用时间和冒泡排序使用的时间差不多,并没有将时间减半,这应该是由于python中list的实现方式的关系,python中的list内部实现机制其实还是数组,只不过数组里面还加了一块缓存空间,这样移动某一个元素,其他的元素也需要移动。所以并没有达到优化冒泡排序的目的(PS:原因分析是基于我自己的理解,可能有不对之处。。。)

双向排序的时间复杂度是O(N**2),是一种稳定排序算法,逻辑比较简单

双向排序算法的源代码:

def MaoPaoOptimizeSort(List):
    for i in range(0, len(List) // 2):
        for j in range(i, len(List) - i - 1):
            if List[i] > List[j]:
                List[i], List[j] = List[j], List[i]
            if List[j] > List[-i - 1]:
                List[j], List[-i - 1] = List[-i - 1], List[j]
    return List

4.插入排序

插入排序原理:从第二个值开始,假定这个值的左边都是有序的序列,找到左边的有序序列中,该值应该插入的位置,然后将这个值插入到 相应的位置,使得左边的序列依旧有序,然后将这个值丢弃。这样执行下去,到最后将整个序列形成一个有序的序列。

插入排序算法在python中的执行时间比冒泡排序短,但是也是属于一个数量级的时间。至于为什么插入排序算法比冒泡排序算法的时间短一半左右,应该也是由于list的内部实现机制的关系,列表由数组组成,在将右边的无序序列中的第一个元素插入到左边的有序序列的时候,右边的元素位置不需要移动,只需要移动左边的序列元素,这样比冒泡排序每次移动所花费的时间要少,平均下来,每次移动的时间要少一半左右。

插入排序的时间复杂度是O(n**2),是一种稳定的排序算法,逻辑比较简单

插入排序算法的源代码:

def ChaRuSort(List):
    for i in range(1, len(List)):
        j = i
        while j > 0 and List[j - 1] > List[i]:
            j -= 1
        List.insert(j, List.pop(i))
    return List

5.希尔排序

希尔排序原理:在序列中,找到一个中间的位置,然后将该序列分成左右两个序列,再将左边序列第一个值与右边序列第一个值进行比较,如果左边大于右边,则进行交换,持续下去,将左右两个序列比较完成后,左右两个序列又分别取中间位置,分成4个序列,再分别在这四个序列中取出第一个数,进行比较,使得四个序列的第一个数是按照从小到大排列的,这样依次下去,直到把四个序列的值都对比完成后,再从这四个序列中再取中间数,将四个序列拆成八个序列,在进行比较,到最后,拆成的序列数量为原来序列长度的一半的时候,原来序列中奇数位置的值都有序了,偶数位置的值也都有序了,这时候再进行最后一次比较,拆出的序列数量等于原来序列长度,这时候再经过一次排序,整个序列有序了。

希尔排序的时间复杂度是O(nlog2n),是一种不稳定的排序算法,逻辑比较复杂

希尔排序算法的源代码:

def XiErSort(List):
    grep = len(List) // 2
    while grep > 0:
        for i in range(grep, len(List)):
            j = i
            while j >= grep and List[j - grep] > List[j]:
                List[j - grep], List[j] = List[j], List[j - grep]
                j -= grep
        grep = grep // 2
    return List

6.归并排序

归并排序原理:归并排序是基于对两个有序序列进行排序变成新的有序序列的方式进行排序的,假如有两个有序序列,从第一个值开始一个一个比较,小的就插入到新的序列中,并使得其位置加一,最后,两个序列中会有某一个序列还剩下最大值,将该最大值插入到新的序列中就完成了排序。归并排序使用递归方式将一个序列从中间分成左右两个序列,再将左右两个序列从中间分成四个序列。递归下去最后分到每个序列中只有一个元素,将这个元素返回,到上一级调用两序列排序方式,将两个值排序,返回新的排序好的序列,就这样一层一层递归上来,最后使得序列有序。该方式是使用空间换取排序时间的算法。

归并排序的时间复杂度是O(nlog2n),是一种稳定的算法,逻辑比较复杂

但是归并排序是使用递归实现的,递归次数较多的话,也会影响排序的时间,但是相对于上面的排序算法,该算法的时间消耗将大大缩短。

归并排序算法的源代码:

class GuiBingSort(object):
    def MergeTwoList(self, List1, List2):
        i, j, tmp = 0, 0, []
        while i < len(List1) and j < len(List2):
            if List1[i] <= List2[j]:
                tmp.append(List1[i])
                i += 1
            else:
                tmp.append(List2[j])
                j += 1
        tmp.extend(List1[i:])
        tmp.extend(List2[j:])
        return tmp

    def GuiBingSort(self, List):
        if len(List) <= 1:
            return List
        List1 = self.GuiBingSort(List[:len(List) // 2])
        List2 = self.GuiBingSort(List[len(List) // 2:])
        return self.MergeTwoList(List1, List2)

7.快速排序

快速排序原理:在序列中找到一个定位点(一般是第一个点)然后将比这个点的值大的值挪到它的右边,比这个值小的值挪到它的左边,最后返回 该点的位置。通过递归调用该方法,将序列分成左右两个序列,然后再细分下去,到最后每个序列中只有两个元素,这两个元素被排好序后返回到上一层,最后返回的将是排序好的序列。

快速排序的时间复杂度是O(nlog2n),最坏情况时间复杂度O(n**2),是一种不稳定的算法,逻辑比较复杂

其实快速排序想要进行优化的话,要找到一个合适的定位点,这个定位点如果总是第一个点的话,当这个点取到的值是最大的值,之后假如每次递归取到的第一个点都是最大的值,那么,这就是快速排序最坏的情况了,这时候。。。递归树就变成了一个序列了。。。是一颗非常不平衡的树。但是如果每次找这个点之前能找到一个合适的点的话,就能够使得递归树变成一颗平衡树,这样就能达到快速排序的最好情况。所以,优化就在这个定位点的选取上,如果总是能把定位点选取合适,那么快速排序是一个非常好的稳定的排序算法。

快速排序算法速度非常快,但是还是比list内置排序法时间上慢了一个数量级,但是,比归并排序少了一半左右的时间,至于为什么比快速排序要快。。。这个我目前还没有找到好的解释办法。。。

快速排序算法的源代码:

def Partition(List, low, high):
    tmp = List[low]
    while low < high:
        while low < high and List[high] >= tmp:
            high = high - 1
        List[low] = List[high]
        while low < high and List[low] <= tmp:
            low = low + 1
        List[high] = List[low]
    List[low] = tmp
    return low


def KuaiSuSort(List, low, high):
    if low < high:
        pivotpos = Partition(List, low, high)
        KuaiSuSort(List, low, pivotpos - 1)
        KuaiSuSort(List, pivotpos + 1, high)

下面是我写的一个demo测试以上排序算法在分别对10000个随机数排序过程中所花费的时间,单位是秒,可供参考:

 

下面是这个demo的源代码,有不足之处还望参考指正:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import random
import time


# 列表生成函数
def CreateList(Num):
    List = []
    i = 0
    while i < Num:
        List.append(random.randint(1, Num))
        i += 1
    return List


# 文件追加
def AddFile(Information, FileName):
    f = open(FileName, 'a', encoding="utf-8")
    f.write(str(Information) + '\n')
    f.close


# 清空文件
def ClearFile(FileName):
    f = open(FileName, 'w')
    f.close()


# 时间计算
def CalaulateteTime(Num, FileName):
    ClearFile(FileName)
    # 系统内置排序
    List = CreateList(Num)
    TimeStart = time.time()
    List.sort()
    TimeStop = time.time()
    AddFile('系统内置排序:\n时间:' + str(TimeStop - TimeStart) + '\n' + str(List), str(FileName))
    # 冒泡排序
    List = CreateList(Num)
    TimeStart = time.time()
    MaoPaoSort(List)
    TimeStop = time.time()
    AddFile('冒泡排序:\n时间:' + str(TimeStop - TimeStart) + '\n' + str(List), str(FileName))
    # 冒泡排序改进
    List = CreateList(Num)
    TimeStart = time.time()
    MaoPaoOptimizeSort(List)
    TimeStop = time.time()
    AddFile('冒泡排序改进,双向排序:\n时间:' + str(TimeStop - TimeStart) + '\n' + str(List), str(FileName))
    # 插入排序
    List = CreateList(Num)
    TimeStart = time.time()
    ChaRuSort(List)
    TimeStop = time.time()
    AddFile('插入排序:\n时间:' + str(TimeStop - TimeStart) + '\n' + str(List), str(FileName))
    # 希尔排序
    List = CreateList(Num)
    TimeStart = time.time()
    XiErSort(List)
    TimeStop = time.time()
    AddFile('希尔排序:\n时间:' + str(TimeStop - TimeStart) + '\n' + str(List), str(FileName))
    # 归并排序
    List = CreateList(Num)
    TimeStart = time.time()
    GuiBing = GuiBingSort()
    List = GuiBing.GuiBingSort(List)
    TimeStop = time.time()
    AddFile('归并排序:\n时间:' + str(TimeStop - TimeStart) + '\n' + str(List), str(FileName))
    # 快速排序
    List = CreateList(Num)
    TimeStart = time.time()
    KuaiSuSort(List, 0, len(List) - 1)
    TimeStop = time.time()
    AddFile('快速排序:\n时间:' + str(TimeStop - TimeStart) + '\n' + str(List), str(FileName))


# 列表排序
# 1冒泡排序
'''
冒泡排序原理就是从左到右先找第一个值,然后拿这个值右边的值和它进行比较,假如右边的值比它小,那就将右边的这个值和它进行交换,
这样,就能够将整个列表中最小的值放到最左边,第一次排序完成,之后对第二个数也进行相同的操作,最终整个列表变成有序的。
'''


def MaoPaoSort(List):
    for i in range(0, len(List) - 1):
        for j in range(i + 1, len(List)):
            if List[i] > List[j]:
                List[i], List[j] = List[j], List[i]
    return List


# 2冒泡排序的改进(双向排序)
'''
冒泡排序的改进其实就是在对第一个值寻找最小值的同时也在对最后一个值寻找最大值,双向寻找,这样,一次排序下来,能得到左右两边两个
排好序的值,这样,总的执行排序的次数将减少一半。
'''


def MaoPaoOptimizeSort(List):
    for i in range(0, len(List) // 2):
        for j in range(i, len(List) - i - 1):
            if List[i] > List[j]:
                List[i], List[j] = List[j], List[i]
            if List[j] > List[-i - 1]:
                List[j], List[-i - 1] = List[-i - 1], List[j]
    return List


# 插入排序
'''
插入排序的原理就是从第二个值开始,假定这个值的左边都是有序的序列,找到左边的有序序列中,该值应该插入的位置,然后将这个值插入到
相应的位置,使得左边的序列依旧有序,然后将这个值丢弃。这样执行下去,到最后将整个序列形成一个有序的序列。
'''


def ChaRuSort(List):
    for i in range(1, len(List)):
        j = i
        while j > 0 and List[j - 1] > List[i]:
            j -= 1
        List.insert(j, List.pop(i))
    return List


# 希尔排序
'''
在序列中,找到一个中间的位置,然后将该序列分成左右两个序列,再将左边序列第一个值与右边序列第一个值进行比较,如果左边大于右边,则
进行交换,持续下去,将左右两个序列比较完成后,左右两个序列又分别取中间位置,分成4个序列,再分别在这四个序列中取出第一个数,进行比
较,使得四个序列的第一个数是按照从小到大排列的,这样依次下去,直到把四个序列的值都对比完成后,再从这四个序列中再取中间数,将四个
序列拆成八个序列,在进行比较,到最后,拆成的序列数量为原来序列长度的一半的时候,原来序列中奇数位置的值都有序了,偶数位置的值也都
有序了,这时候再进行最后一次比较,拆出的序列数量等于原来序列长度,这时候再经过一次排序,整个序列有序了。
'''


def XiErSort(List):
    grep = len(List) // 2
    while grep > 0:
        for i in range(grep, len(List)):
            j = i
            while j >= grep and List[j - grep] > List[j]:
                List[j - grep], List[j] = List[j], List[j - grep]
                j -= grep
        grep = grep // 2
    return List


# 归并排序
'''
归并排序是基于对两个有序序列进行排序变成新的有序序列的方式进行排序的,假如有两个有序序列,从第一个值开始一个一个比较,小的就插入
到新的序列中,并使得其位置加一,最后,两个序列中会有某一个序列还剩下最大值,将该最大值插入到新的序列中就完成了排序。归并排序使用
递归方式将一个序列从中间分成左右两个序列,再将左右两个序列从中间分成四个序列。递归下去最后分到每个序列中只有一个元素,将这个元素
返回,到上一级调用两序列排序方式,将两个值排序,返回新的排序好的序列,就这样一层一层递归上来,最后使得序列有序。该方式是使用空间
换取排序时间的算法。
'''


class GuiBingSort(object):
    def MergeTwoList(self, List1, List2):
        i, j, tmp = 0, 0, []
        while i < len(List1) and j < len(List2):
            if List1[i] <= List2[j]:
                tmp.append(List1[i])
                i += 1
            else:
                tmp.append(List2[j])
                j += 1
        tmp.extend(List1[i:])
        tmp.extend(List2[j:])
        return tmp

    def GuiBingSort(self, List):
        if len(List) <= 1:
            return List
        List1 = self.GuiBingSort(List[:len(List) // 2])
        List2 = self.GuiBingSort(List[len(List) // 2:])
        return self.MergeTwoList(List1, List2)


# 快速排序
'''
快速排序的原理是在序列中找到一个定位点(一般是第一个点)然后将比这个点的值大的值挪到它的右边比这个值小的值挪到它的左边,最后返回
该点的位置通过递归调用该方法,将序列分成左右两个序列,然后再细分下去,到最后每个序列中只有两个元素,这两个元素被排好序后返回倒上
一层,最后返回的将是排序好的序列。
'''


def Partition(List, low, high):
    tmp = List[low]
    while low < high:
        while low < high and List[high] >= tmp:
            high = high - 1
        List[low] = List[high]
        while low < high and List[low] <= tmp:
            low = low + 1
        List[high] = List[low]
    List[low] = tmp
    return low


def KuaiSuSort(List, low, high):
    if low < high:
        pivotpos = Partition(List, low, high)
        KuaiSuSort(List, low, pivotpos - 1)
        KuaiSuSort(List, pivotpos + 1, high)


if __name__ == "__main__":
    ClearFile('排序结果.txt')
    CalaulateteTime(10000, '排序结果.txt')
    print('calculate is successful,the file is test.txt')
本程序源代码

 

 

posted @ 2017-02-11 11:36  runnering  阅读(79)  评论(0)    收藏  举报