> 文章列表 > set (集合)数据结构

set (集合)数据结构

set (集合)数据结构

set(集合)是⼀个⾮常有⽤的数据结构。

它与列表(list)的⾏为类似,区别在于set 不能 包含重复的值。

例如你可能想检查列表中是否包含重复的元素,你有两个选 择,第⼀个需要

使⽤for循环,就像这样:

some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']
duplicates = []
for value in some_list:if some_list.count(value) > 1:if value not in duplicates:duplicates.append(value)print(duplicates)

输出: [‘b’, ‘n’]

但还有⼀种更简单更优雅的解决⽅案,那就是使⽤集合 (sets)。

你直接这样做:

some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']
duplicates = set([x for x in some_list if some_list.count(x) > 1])
print(duplicates)

输出: set([‘b’, ‘n’])

集合还有⼀些其它⽅法,下⾯我们介绍其中⼀部分。

交集

你可以对⽐两个集合的交集(两个集合中都有的数据),如下:

valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.intersection(valid))

输出: set([‘red’])

差集

你可以⽤差集(difference)找出⽆效的数据,相当于⽤⼀个集合减去另⼀个集合的数据

例 如:valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.difference(valid))

输出: set([‘brown’])

你也可以⽤符号来创建集合例如:a_set = {'red', 'blue', 'green'}
print(type(a_set))

输出: <type ‘set’>