⚡C++ STL 与迭代器

常用容器对比与选型（C++ 面试高频）

面试回答

常见问法

vector、deque、list、map、unordered_map 应该怎么选？
为什么工程里通常更推荐 vector，而不是 list？
map 和 unordered_map 谁更快？真实差别是什么？
deque 和 vector 有什么本质区别？
面试里怎么讲容器选型，才不是只背复杂度表？

回答

容器选型不能只看时间复杂度，真正面试高分回答，一定要按访问模式 + 顺序需求 + 迭代器稳定性 + 内存/缓存特性 + 工程约束来讲。

我一般按下面 5 个维度做判断：

是否需要连续内存
是否需要高效随机访问
插入删除主要发生在哪个位置
是否要求元素有序
是否在意迭代器/引用稳定性、内存占用、缓存友好性

面试里可以先给结论，再给依据：

默认优先 vector 因为它连续内存、缓存命中率高、随机访问快、尾插摊还高效，而且额外内存开销小。很多场景里它的实际性能比理论上“插删更优”的容器更好。
两端插入删除很多时选 deque 它支持头尾高效操作，也支持随机访问，但不是整块连续内存，所以缓存局部性通常不如 vector。
频繁中间插删且已经拿到了插入位置迭代器，同时还要求节点稳定时，才考虑 list 它节点式存储，插删本身是 O(1)，但查找位置还是 O(n)，而且内存碎片和指针开销大，遍历性能一般较差，所以工程里远没有想象中常用。
需要按 key 有序、范围查询、前驱后继、lower_bound/upper_bound 时用 map 它通常是红黑树，实现稳定的 O(log n) 查找/插入/删除，并且天然有序。
只关心平均查找性能，不关心顺序时用 unordered_map 平均 O(1)，适合哈希查表。但要注意它最坏可能退化到 O(n)，并且会有 rehash、桶冲突、内存占用较高、遍历无序等问题。

一句话总结就是：

先问访问模式，再问顺序要求，再问稳定性，最后才看复杂度表。

追问

1. 为什么工程里通常更推荐 `vector` 而不是 `list`？

因为工程里真实瓶颈经常不是“单次插删复杂度”，而是CPU cache 命中率、内存分配次数、遍历效率。 vector 连续内存，遍历和随机访问都很友好；list 每个节点都要额外存前后指针，节点分散，cache locality 差，实际跑起来经常不如 vector。

另外，很多人说 list 中间插删 O(1)，但这只在已经拿到那个位置迭代器时成立；如果先要查找到那个位置，整体还是 O(n)。

2. `map` 和 `unordered_map` 的真实取舍是什么？

不是简单地说“unordered_map 更快”。真实取舍要看：

是否需要有序遍历
是否需要范围查询
是否能接受最坏情况退化
是否关心内存占用
是否希望性能更稳定、可预测

通常：

要顺序 / 范围查询 / 稳定复杂度：map
纯查表、热点 key 查询、平均性能优先：unordered_map

3. `deque` 和 `vector` 的差异是什么？

vector：一块连续内存，随机访问快，缓存友好，尾部增长高效，但头部插入删除代价大。
deque：分段连续结构，支持头尾高效插删，也支持随机访问，但整体局部性一般不如 vector，并且不能把它简单当成“可随意替代 vector 的双端版”。

4. `list` 什么时候才真正值得用？

同时满足下面条件时才值得认真考虑：

中间插删非常频繁
已经能直接拿到要插删的位置
需要节点稳定，不希望因为扩容导致地址失效
不依赖随机访问
对遍历性能不是最敏感

这几个条件现实里并不常同时成立，所以 list 在工程中通常不是默认解。

原理展开

1. `vector`：默认首选，不是因为“最强”，而是因为“综合最优”

vector 的核心优势是连续内存。

这会带来几个很重要的工程收益：

缓存友好：遍历时预取效果好，CPU 更容易命中 cache
随机访问 O(1)：下标访问非常自然
尾插摊还 O(1)：扩容不是每次都发生
额外空间开销小：没有像链表那样的节点指针负担
和 C 接口/底层数组兼容性更好

典型场景：

大量遍历
排序
二分查找
尾部追加
需要按下标访问

std::vector<int> nums;
nums.reserve(1000);   // 已知大概容量时，提前 reserve 减少扩容
nums.push_back(1);
nums.push_back(2);

for (int x : nums) {
    // 顺序遍历，缓存友好
}

但它也有边界：

中间插删通常需要移动元素
头部插入删除代价高
扩容可能导致迭代器、引用、指针失效

所以 vector 不是无脑用，而是默认先考虑，有明确反例再换。

2. `deque` 与 `list`：都不是 `vector` 的简单替代品

`deque`

deque 可以理解为支持两端高效操作的随机访问序列容器。它通常是分段存储，不要求整体物理连续。

优点：

头尾插删高效
支持随机访问
不像 vector 那样只能高效尾插

缺点：

内存布局不如 vector 连续
缓存局部性一般弱于 vector
作为普通遍历容器，常常不如 vector 自然

适用场景：

队列/双端队列
滑动窗口
需要频繁 push_front() / push_back()

std::deque<int> dq;
dq.push_front(1);
dq.push_back(2);
int x = dq[0];  // 支持随机访问

`list`

list 是双向链表，本质是节点式容器。

优点：

已知位置时插删 O(1)
节点地址通常更稳定
适合频繁 splice/节点搬移一类操作

缺点：

不支持随机访问
查找位置 O(n)
每个节点至少有额外指针开销
内存不连续，cache locality 差
分配器开销、碎片问题更明显

很多人面试里会说：

“list 插删 O(1)，所以频繁插删就用 list。”

这句话不完整。更准确地说应该是：

如果插删频繁，而且插删位置已知，同时还很在意节点稳定性，list 才可能合适。

3. `map` vs `unordered_map`：本质是“树”与“哈希表”的取舍

`map`

map 底层通常是红黑树，核心特征是按 key 有序。

优点：

查找/插入/删除稳定 O(log n)
支持有序遍历
支持范围查询
支持 lower_bound / upper_bound
性能上界更可预测

缺点：

常数因子通常比哈希表大
节点式结构，内存开销较高
纯查表场景不一定占优

std::map<int, std::string> mp;
mp[3] = "c";
mp[1] = "a";
mp[2] = "b";

for (auto& [k, v] : mp) {
    // 输出顺序按 key 排序：1,2,3
}

`unordered_map`

unordered_map 底层通常是哈希表 + 桶。

优点：

平均查找/插入/删除 O(1)
纯 key 查表场景往往更高效

缺点：

无序
最坏可退化为 O(n)
rehash 会带来性能抖动和迭代器失效
需要好的哈希函数
内存占用通常不低

std::unordered_map<int, int> cache;
cache.reserve(1024);  // 已知规模时预留桶，减少 rehash
cache[42] = 100;

真实工程取舍

在线查询、缓存、计数器：倾向 unordered_map
需要排序输出、TopK 的有序辅助结构、范围查询：倾向 map
高可靠/稳定时延要求较高：map 的复杂度上界更稳定
key 类型复杂、哈希质量难保证：要谨慎使用 unordered_map

4. 面试里真正加分的选型方法：按“约束”倒推容器

高分回答不要只是报结论，要体现决策过程。可以按下面顺序分析：

第一步：是否需要顺序/范围语义？

需要按 key 有序遍历
需要区间查询
需要找前驱后继
需要 lower_bound

这类需求直接把选择推向 map/set。

第二步：是否主要是查表？

如果核心诉求是“根据 key 快速查值”，而且不需要有序，那么优先考虑 unordered_map/unordered_set。

第三步：是否需要随机访问？

要按下标访问：vector / deque
不需要随机访问：list 才有可能进入备选

第四步：插删发生在哪？

尾部为主：vector
头尾都多：deque
中间且位置已知：list

第五步：是否在意迭代器/引用稳定性？

vector 扩容会失效
unordered_map rehash 可能失效
list / map 这类节点式容器通常稳定性更好

第六步：是否重视缓存局部性与空间效率？

如果重视，优先考虑连续或更紧凑的存储结构，通常就是 vector，其次根据场景看 deque。

对比总结

容器	底层结构	随机访问	插入删除特点	是否有序	迭代器/引用稳定性	内存/缓存表现	典型场景	不适合场景
`vector`	连续数组	强，O(1)	尾插摊还 O(1)，中间/头部插删需要搬移	否	扩容后可能失效	最好，缓存友好	默认容器、遍历、排序、下标访问	频繁头插、中间大量插删
`deque`	分段数组	强，O(1)	头尾插删高效，中间插删一般	否	比 `vector` 更复杂，不如节点式稳定	一般，弱于 `vector`	双端队列、滑动窗口	极致缓存友好要求、需要整体连续内存
`list`	双向链表	不支持	已知位置插删 O(1)	否	通常较稳定	差，节点分散	频繁中间插删、节点稳定、splice	大量遍历、随机访问、只是假想“插删多”
`map`	红黑树	不支持	查找/插删 O(log n)	是	通常较稳定	一般，节点开销较大	有序 key、范围查询、前驱后继	纯哈希查表场景
`unordered_map`	哈希表	不适用	平均 O(1)，最坏 O(n)	否	rehash 可能失效	一般，桶和节点开销不低	高频查表、缓存、计数	需要顺序、范围查询、稳定时延

相近概念补充对比

对比项	`vector`	`deque`	`list`
是否连续内存	是	否（通常分段）	否
头部插入	慢	快	快
尾部插入	快	快	快
中间插入	慢	一般	已知位置快
遍历性能	最好	较好	较差
默认优先级	最高	特定需求时考虑	很少默认选

对比项	`map`	`unordered_map`
底层	红黑树	哈希表
顺序	有序	无序
查找复杂度	O(log n)	平均 O(1)，最坏 O(n)
范围查询	支持	不支持
性能稳定性	更稳定	更依赖哈希质量
适合	顺序语义、边界查找	高频查表、缓存

易错点

只会背复杂度，不会说访问模式和工程约束 面试官更想听“为什么这样选”，不是听你复读表格。
误以为 list 适合所有频繁插删场景 中间插删 O(1) 的前提是位置已知；如果位置还要先查，整体并不占优。
认为 unordered_map 一定比 map 快 这是不严谨的。平均复杂度更好，不代表所有场景更好。需要有序、范围查询、稳定复杂度时，map 反而更合适。
忽略 vector 的缓存友好性 很多真实工程场景，vector 因为连续内存而明显更快。
忽略迭代器/引用失效问题 vector 扩容、unordered_map rehash 都可能导致已有迭代器失效，面试追问很常见。
把 deque 说成“支持头插的 vector” 这说法太粗糙。二者底层结构、连续内存特性、性能侧重点都不同。
看到中间插删需求就直接选 list 还要继续问：插删位置怎么定位？是否需要遍历？是否真的需要节点稳定？

记忆技巧

一条主线： 默认 vector，特殊需求再切换。
五步选型法： 顺序 → 查表 → 随机访问 → 插删位置 → 稳定性
速记口诀：
- 默认首选：vector
- 头尾操作多：deque
- 节点稳定、位置已知的中间插删：list
- 需要有序：map
- 平均查找快：unordered_map
一句判断原则： 复杂度是门票，数据布局才决定很多真实性能。

面试速答版

容器选型我不会只背复杂度，我会先看访问模式和工程约束。默认我优先选 vector，因为它连续内存、缓存友好、随机访问快、尾插摊还高效，综合性能通常最好。如果需要头尾高效插删，我会考虑 deque；如果是中间频繁插删，而且已经拿到位置迭代器，还要求节点稳定，才会考虑 list。关联容器里，如果需要有序遍历、范围查询、lower_bound 这类能力，我选 map；如果只是做高频查表、不关心顺序，我选 unordered_map，但也会注意它最坏退化、rehash 和内存开销问题。所以本质不是背哪个复杂度低，而是根据顺序需求、访问方式、插删位置、稳定性和缓存友好性来选。

面试加分版

我理解容器选型不能只看理论复杂度，而要看数据布局和真实访问模式。我的原则是：默认优先 vector，有明确需求再换其他容器。

先说 vector，它最大的优势不是“所有操作都最快”，而是综合最优。它是连续内存，遍历时 cache 命中率高，随机访问 O(1)，尾插摊还 O(1)，额外内存开销也小。所以只要场景是“遍历多、排序多、按下标访问多、主要尾插”，vector 往往是首选。

如果场景变成头尾两端都频繁操作，我会考虑 deque。它也支持随机访问，但通常是分段存储，所以局部性不如 vector。如果有人提 list，我会特别强调：list 适合的是位置已知的中间插删，并且还要求节点稳定；如果插删前还得先查找位置，那整体复杂度还是高，而且因为链表节点分散、指针开销大、cache locality 差，工程里很多时候实际性能不如 vector。

再看关联容器。如果需要有序 key、范围查询、前驱后继、lower_bound/upper_bound，我会选 map，因为它通常基于红黑树，查找/插入/删除稳定 O(log n)，而且有序语义很强。如果只是做纯查表，比如缓存、计数、哈希索引，我会优先 unordered_map，因为平均查找 O(1)。但我不会简单说它一定更快，因为它有最坏 O(n) 退化、rehash 带来的抖动，以及无序、内存占用更高等问题。

所以我实际面试里会这么总结： 先看要不要有序，再看是不是查表，再看是否需要随机访问，然后再判断插删位置和迭代器稳定性，最后再结合缓存友好和内存开销做工程取舍。 这样回答会比单纯背复杂度更像真实工程判断。