C中的vector是什么意思?

摘要:深入理解 C++ 中最常用的容器 std::vector:动态数组的核心特性、内存管理、扩容机制、迭代器失效问题,以及 reserve、emplace_back 等现代化最佳实践。特别提醒 std::ve
目录核心特性与底层原理初始化与构造容量与大小为什么 reserve 非常重要?增删查改插入与添加删除访问迭代器失效特殊版本:std::vector<bool>现代化操作C++20:std::erase 和 std::erase_if最佳实践 本文首发于我的个人博客:Better Mistakes 版权声明:本文为原创文章,转载请附上原文出处链接及本声明。 由于技术迭代较快,文章内容可能随时更新(含勘误及补充)。为了确保您看到的是最新版本,并获得更好的代码阅读体验,请访问: 🍭 原文链接:https://bfmhno3.github.io/note/vector-in-cpp/ std::vector 是 C++ 中最重要、最常用的容器,没有之一。它的本质是动态数组(Dynamic Array)。 std::vector 是在堆(Heap)上管理一块连续的内存,可以存放任意类型的对象。 核心特性与底层原理 头文件:#include <vector> 内存模型:连续内存。这意味着它和 C 数组一样,支持通过指针偏移量快速访问,并且对 CPU 缓存(Cache)非常友好。 自动扩容:当存入数据量超过当前容量时,std::vector 就会申请一块更大的内存(通常是原来的 1.5 倍或 2 倍),将旧数据移动/拷贝过去,然后释放旧内存。 初始化与构造 #include <vector> // 1. 默认构造(空 vector) std::vector<int> v1; // 2. 指定大小和默认值 std::vector<int> v2(10); // 10 个元素,默认初始化 0 std::vector<int> v3(10, 5); // 10 个元素,每个都是 5 // 3. 列表初始化(C++11) std::vector<int> v4 = {1, 2, 3, 4}; // 4. 拷贝构造 std::vector<int> v5(v4); // 5. 迭代器范围构造(常用与从其他容器拷贝) int arr[] = {10, 20, 30} std::vector<int> v6(arr, arr + 3); 容量与大小 函数 说明 备注 size() 当前元素个数 实际存了多少个 capacity() 当前分配的内存能存多少个 capacity \(\geqslant\) size empty() 是否为空 推荐使用,比 size() == 0 更语义化 reserve() 预分配内存 仅改变 capacity,不改变 size resize(n) 改变元素个数 改变 size,如果变大则填充默认值 shrink_to_fit() 释放未使用的内存(C++11) 让 capacity 搜索到 size 大小 为什么 reserve 非常重要? std::vector<int> v; v.reserve(1000); // 一次性分配好内存 for (int i = 0; i < 1000; i++) { v.push_back(i); // 这里不会再发生内存重新分配,效率极高 } 增删查改 插入与添加 push_back(val):在尾部添加元素(会发生拷贝或移动)。 emplace_back(arg...)(C++11):原地构造。直接在 std::vector 尾部构造对象,省去了一次临时对象的构造和拷贝 / 移动,效率通常更高。 insert(it, val):在迭代器指向的位置插入。效率为 \(O(N)\),因为要移动后续所有元素。 删除 pop_back:删除尾部元素(\(O(1)\))。 erase(it):删除指定位置元素(\(O(N)\),后续元素前移)。 clear():清空所有元素,szie 变为 0,但 capacity 通常不变(内存不释放)。 访问 v[i]:下标访问,不检查越界。 v.at[i]:检查越界,越觉抛 std::out_of_range。 v.front() / v.back():访问首尾。 v.data():返回指向底层数组首元素的指针(T*)。常用于和 C 语言 API 交互。 迭代器失效 由于 std::vector 是连续内存,当结构发生变化时,指向旧内存的迭代器、指针、引用可能会失效。 扩容时失效:当 push_back 导致 std::vector 扩容(reallocate)时,原内存被释放,所有指向原数据的迭代器 / 指针瞬间全部失效。 插入 / 删除时失效:当 insert 或 erase 一个位置时,该位置之后的所有迭代器都会失效(因为数据移动了)。 std::vector<int> v = {1, 2, 3, 4}; for (auto it = v.begin(); it != v.end(); ++it) { if (*it % 2 == 0) { v.erase(it); // 错误!erase 后 it 已失效,下一次 ++it 会崩溃 } } // 正确写法(利用 erase 返回值更新迭代器) for (auto it = v.begin(); it != v.end()) { if (*it % 2 == 0) { it = v.erase(it); // erase 返回指向下一个元素的迭代器 } else { ++it; } } 特殊版本:std::vector<bool> 这是一个历史遗留的 “坑”。为了节省空间,C++ 标准库特化了 std::vector<bool>,它不是存储 bool(1 字节),而是存储 bit(1 比特)。 后果: 你无法获得元素的地址:&v[0] 是非法的,因为无法寻址单个比特。 它的 operator[] 返回的不是 bool&,而是一个代理对象。 非线程安全:并发读写邻近的 bit 可能会导致数据竞争(因为它们位于同一个字节内)。 建议:如果需要存布尔值且不缺那点内存,用 std::vector<char> 或 std::deque<bool> 代替。如果确实需要位操作,考虑使用 std::bitset。 现代化操作 C++20:std::erase 和 std::erase_if 在 C++20 之前,要从 std::vector 中删除满足特定条件的所以元素,需要使用 "Erase-Remove Idiom"(v.erase(std::remove(...), v.end()),非常啰嗦。 C++20 简化了: std::vector<int> v = {1, 2, 3, 4, 5, 6}; // 删除所有偶数 std::erase_if(v, [](int x) { return x % 2 == 0; }); 最佳实践 优先使用 emplace_back:代替 push_back,特别是存放复杂对象时。 善用 reserve:如果你能预估数据量,一定要先 reserve,在数据量较大时,能够极大的优化性能。 避免头部/中间插入:在 std::vector 头部插入数据(insert(begin(), val))是非常慢的(\(O(N)\)),如果有这种需求,请改用 std::deque 或 std::list。 慎用 std::vector<bool>:除非你清楚你自己在做什么。 小心引用失效:在循环中做 push_back 时,千万不要同时持有指向该 std::vector 内部元素的引用,一旦扩容,引用就变成悬空指针了。 📢 写在最后 如果你觉得这篇文章对你有帮助,欢迎到我的个人博客 Better Mistakes 逛逛。 在那里我归档了更多高质量的技术文章,也欢迎通过 RSS 订阅我的最新动态!