python中如何对list之间求交集,并集和差集

最近遇到一个从list a里面去除list b的元素的问题,由于a很大,b也不小。所以遇到点困难,现在mark一下。

先说最简单的方法:

1 a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
2 b = [2, 5, 8, 11, 0]
3 # intersection
4 intersection = [v for v in a if v in b]
5 # union
6 union = b.extend([v for v in a])
7 # difference
8 difference = [v for v in a if v not in b]

这种方法就是逻辑->代码,没有深层次的考虑。当然这里所有的代码没有用到for loop,也没有使用list的append和remove方法,因为这样写很pythonic,效率上来看个人感觉比append和remove的使用应该也会高。但是这种方法是不加思考的。其实计算两个list的交并补之类的操作,其实是集合间的操作,如果list里面有重复元素再进行这样的操作其实没有什么意义。所以从集合的操作角度来讲,交并补可以借鉴bitset的处理方法。当list的长度很大的时候,效率会高出很多倍。

高效率的方法:

1 # intersection
2 intersection = list(set(a).intersection(set(b)))
3 # union
4 union = list(set(a).union(set(b)))
5 # difference
6 difference = list(set(a).difference(set(b)))

 

posted @ 2017-07-08 18:25  chen-kh  阅读(...)  评论(...编辑  收藏