> 文章列表 > 【STL系列】unordered_set和unordered_map

【STL系列】unordered_set和unordered_map

【STL系列】unordered_set和unordered_map

前言

之前,我们介绍了STL中树形结构容器:set、map、multiset、multimap。

在C++98中,STL提供了底层为红黑树结构的一系列关联式容器,在查询时的效率可达到O(logN),即最差情况下需要比较红黑树的高度次,但当树中的结点非常多时,查询效率也不理想。最好的查询是,进行很少的比较次数就能够将元素找到,因此在C++11中,STL又提供了4个unordered系列的关联式容器,这四个容器与红黑树结构的关联式容器使用方式基本类似,只是其底层结构不同。


【STL系列】unordered_set和unordered_map
【STL系列】unordered_set和unordered_map


unordered_set

unordered_set的介绍

  • unordered_set是不按特定顺序存储键值的关联式容器,其允许通过键值快速的索引到对应的元素。
  • 在unordered_set中,元素的值同时也是唯一地标识它的key。
  • 在内部,unordered_set中的元素没有按照任何特定的顺序排序,为了能在常数范围内找到指定的key,unordered_set将相同哈希值的键值放在相同的桶中。
  • unordered_set容器通过key访问单个元素要比set快,但它通常在遍历元素子集的范围迭代方面效率较低。
  • 它的迭代器至少是前向迭代器。

unordered_set的定义

//方式一: 构造一个某类型的空容器。
unordered_set<int> us1; //构造int类型的空容器//方式二: 拷贝构造某同类型容器的复制品。
unordered_set<int> us2(us1); //拷贝构造同类型容器us1的复制品//方式三: 使用迭代器拷贝构造某一段内容。
string str("abcedf");
unordered_set<char> us3(str.begin(), str.end()); //构造string对象某段区间的复制品

unordered_set接口的使用

unordered_set当中常用的成员函数如下:

成员函数 功能
insert 插入指定元素
erase 删除指定元素
find 查找指定元素
size 获取容器中元素的个数
empty 判断容器是否为空
clear 清空容器
swap 交换两个容器中的数据
count 获取容器中指定元素值的元素个数

unordered_set当中迭代器相关函数如下:

成员函数 功能
begin 获取容器中第一个元素的正向迭代器
end 获取容器中最后一个元素下一个位置的正向迭代器

实例:

#include <iostream>
#include <unordered_set>
using namespace std;int main()
{unordered_set<int> us;//插入元素(去重)us.insert(1);us.insert(4);us.insert(3);us.insert(3);us.insert(2);us.insert(2);us.insert(3);//遍历容器方式一(范围for)for (auto e : us){cout << e << " ";}cout << endl; //1 4 3 2//删除元素方式一us.erase(3);//删除元素方式二unordered_set<int>::iterator pos = us.find(1); //查找值为1的元素if (pos != us.end()){us.erase(pos);}//遍历容器方式二(迭代器遍历)unordered_set<int>::iterator it = us.begin();while (it != us.end()){cout << *it << " ";it++;}cout << endl; //4 2//容器中值为2的元素个数cout << us.count(2) << endl; //1//容器大小cout << us.size() << endl; //2//清空容器us.clear();//容器判空cout << us.empty() << endl; //1//交换两个容器的数据unordered_set<int> tmp{ 11, 22, 33, 44 };us.swap(tmp);for (auto e : us){cout << e << " ";}cout << endl; //11 22 33 44return 0;
}

unordered_multiset

unordered_multiset容器与unordered_set容器的底层数据结构是一样的,都是哈希表,其次,它们所提供的成员函数的接口都是基本一致的,这两种容器唯一的区别就是,unordered_multiset容器允许键值冗余,即unordered_multiset容器当中存储的元素是可以重复的。

实例:

#include <iostream>
#include <unordered_set>
using namespace std;int main()
{unordered_multiset<int> ums;//插入元素(允许重复)ums.insert(1);ums.insert(4);ums.insert(3);ums.insert(3);ums.insert(2);ums.insert(2);ums.insert(3);for (auto e : ums){cout << e << " ";}cout << endl; //1 4 3 3 3 2 2return 0;
}

unordered_map

unordered_map的介绍

  • unordered_map是存储<key, value>键值对的关联式容器,其允许通过key值快速的索引到与其对应是value。
  • 在unordered_map中,键值通常用于唯一地标识元素,而映射值是一个对象,其内容与此键关联。键和映射值的类型可能不同。
  • 在内部,unordered_map没有对<key, value>按照任何特定的顺序排序,为了能在常数范围内找到key所对应的value,unordered_map将相同哈希值的键值对放在相同的桶中。
  • unordered_map容器通过key访问单个元素要比map快,但它通常在遍历元素子集的范围迭代方面效率较低。
  • unordered_map实现了直接访问操作符(operator[]),它允许使用key作为参数直接访问value。
  • 它的迭代器至少是前向迭代器。

unordered_map的定义

//方式一: 指定key和value的类型构造一个空容器。unordered_map<int, double> um1; //构造一个key为int类型,value为double类型的空容器//方式二: 拷贝构造某同类型容器的复制品。unordered_map<int, double> um2(um1); //拷贝构造同类型容器um1的复制品//方式三: 使用迭代器拷贝构造某一段内容。unordered_map<int, double> um3(um2.begin(), um2.end()); //使用迭代器拷贝构造um2容器某段区间的复制品

unordered_map接口的使用

unordered_map当中常用的成员函数如下:

成员函数 功能
insert 插入键值对
erase 删除指定key值的键值对
find 查找指定key值的键值对
size 获取容器中元素的个数
empty 判断容器是否为空
clear 清空容器
swap 交换两个容器中的数据
count 获取容器中指定key值的元素个数

除了上述的成员函数之外,unordered_map容器当中还实现了[ ]运算符重载函数

[key]
  • 若当前容器中已有键值为key的键值对,则返回该键值对value的引用。
  • 若当前容器中没有键值为key的键值对,则先插入键值对<key, value()>,然后再返回该键值对中value的引用。

unordered_map当中迭代器相关函数如下:

成员函数 功能
begin 获取容器中第一个元素的正向迭代器
end 获取容器中最后一个元素下一个位置的正向迭代器

实例:

#include <iostream>
#include <string>
#include <unordered_map>
using namespace std;int main()
{unordered_map<int, string> um;//插入键值对方式一:构造匿名对象插入um.insert(pair<int, string>(1, "one"));um.insert(pair<int, string>(2, "two"));um.insert(pair<int, string>(3, "three"));//遍历方式一:范围forfor (auto e : um){cout << e.first << "->" << e.second << " ";}cout << endl; //1->one 2->two 3->three//插入键值对方式二:调用make_pair函数模板插入um.insert(make_pair(4, "four"));um.insert(make_pair(5, "five"));um.insert(make_pair(6, "six"));//遍历方式二:迭代器遍历unordered_map<int, string>::iterator it = um.begin();while (it != um.end()){cout << it->first << "->" << it->second << " ";it++;}cout << endl; //1->one 2->two 3->three 4->four 5->five 6->six//插入键值对方式三:利用[]运算符重载函数进行插入(常用)um[7] = "seven";um[8] = "eight";um[9] = "nine";for (auto e : um){cout << e.first << "->" << e.second << " ";}cout << endl; //9->nine 1->one 2->two 3->three 4->four 5->five 6->six 7->seven 8->eight//删除键值对方式一:根据key值删除um.erase(5);//删除键值对方式二:根据迭代器删除unordered_map<int, string>::iterator pos = um.find(7); //查找键值为7的键值对if (pos != um.end()){um.erase(pos);}for (auto e : um){cout << e.first << "->" << e.second << " ";}cout << endl; //9->nine 1->one 2->two 3->three 4->four 6->six 8->eight//修改键值对方式一:通过find获得迭代器,通过迭代器修改pos = um.find(1);if (pos != um.end()){pos->second = "one/first";}//修改键值对方式二:利用[]运算符重载函数进行修改(常用)um[2] = "two/second";for (auto e : um){cout << e.first << "->" << e.second << " ";}cout << endl; //9->nine 1->one/first 2->two/second 3->three 4->four 6->six 8->eight//容器中key值为3的键值对的个数cout << um.count(3) << endl;//容器的大小cout << um.size() << endl;//清空容器um.clear();//容器判空cout << um.empty() << endl;//交换两个容器的数据unordered_map<int, string> tmp{ { 2021, "before" }, { 2022, "now" } };um.swap(tmp);for (auto e : um){cout << e.first << "->" << e.second << " ";}cout << endl; //2021->before 2022->nowreturn 0;
}

unordered_multimap

unordered_multimap容器与unordered_map容器的底层数据结构是一样的,都是哈希表,其次,它们所提供的成员函数的接口都是基本一致的,这两种容器唯一的区别就是,unordered_multimap容器允许键值冗余,即unordered_multimap容器当中存储的键值对的key值是可以重复的。

实例:

#include <iostream>
#include <string>
#include <unordered_map>
using namespace std;int main()
{unordered_multimap<int, string> umm;//插入键值对(允许键值重复)umm.insert(make_pair(2022, "吃饭"));umm.insert(make_pair(2022, "睡觉"));umm.insert(make_pair(2022, "打豆豆"));for (auto e : umm){cout << e.first << "->" << e.second << " ";}cout << endl; //2022->吃饭 2022->睡觉 2022->打豆豆return 0;
}

注意:由于unordered_multimap容器允许键值对的键值冗余,调用[ ]运算符重载函数时,应该返回键值为key的哪一个键值对的value的引用存在歧义,因此在unordered_multimap容器当中没有实现[ ]运算符重载函数。

map/set与unordered_map/unordered_set的区别

【STL系列】unordered_set和unordered_map

map容器与unordered_map容器的差别和set容器与unordered_set容器的差别类似,下面我们以set容器和unordered_set容器的测试为例。

说到一个容器的性能,我们最关心的实际就是该容器增删查改的效率。我们可以通过下列代码测试set容器和unordered_set容器insert、find以及erase的效率。

#include <iostream>
#include <set>
#include <unordered_set>
#include <time.h>
using namespace std;int main()
{int N = 1000;vector<int> v;v.reserve(N);srand((unsigned int)time(NULL));//随机生成N个数字for (int i = 0; i < N; i++){v.push_back(rand());}/****************插入效率测试****************///将这N个数插入set容器set<int> s;clock_t begin1 = clock();for (auto e : v){s.insert(e);}clock_t end1 = clock();//将这N个数插入unordered_set容器unordered_set<int> us;clock_t begin2 = clock();for (auto e : v){us.insert(e);}clock_t end2 = clock();//分别输出插入set容器和unordered_set容器所用的时间cout << "set insert: " << end1 - begin1 << endl;cout << "unordered_set insert: " << end2 - begin2 << endl;/****************查找效率测试****************///在set容器中查找这N个数clock_t begin3 = clock();for (auto e : v){s.find(e);}clock_t end3 = clock();//在unordered_set容器中查找这N个数clock_t begin4 = clock();for (auto e : v){us.find(e);}clock_t end4 = clock();//分别输出在set容器和unordered_set容器中查找这N个数所用的时间cout << "set find: " << end3 - begin3 << endl;cout << "unordered_set find: " << end4 - begin4 << endl;/****************删除效率测试****************///将这N个数从set容器中删除clock_t begin5 = clock();for (auto e : v){s.erase(e);}clock_t end5 = clock();//将这N个数从unordered_set容器中删除clock_t begin6 = clock();for (auto e : v){us.erase(e);}clock_t end6 = clock();//分别输出将这N个数从set容器和unordered_set容器中删除所用的时间cout << "set erase: " << end5 - begin5 << endl;cout << "unordered_set erase: " << end6 - begin6 << endl;return 0;
}

当N比较小时,两者的效率时差不多的,我们稍微将N设置大一些,将N设为10000000。

而当N为10000000时,set容器和unordered_set容器增删查改的效率的差异就很明显了,unordered_set优于set。

【STL系列】unordered_set和unordered_map

根据测试结果可以得出以下结论:

  • 当处理数据量小时,map/set容器与unordered_map/unordered_set容器增删查改的效率差异不大。
  • 当处理数据量大时,map/set容器与unordered_map/unordered_set容器增删查改的效率相比,unordered系列容器的效率更高。

因此,当处理数据量较小时,选用xxx容器与unordered_xxx容器的差异不大;当处理数据量较大时,建议选用对应的unordered_xxx容器。

当需要存储的序列为有序时,应该选用map/set容器。