standrad c++ – 第 214 页

C++20协程的原理与实践

2026-01-11 作者 stdcpp

C++20 在标准库中正式加入了协程（coroutine）支持，极大地简化了异步编程和生成器的实现。本文将从协程的基本概念、实现原理、关键标准库组件以及一个实际案例三个部分，系统阐述协程在 C++20 中的工作方式，并展示如何在项目中使用它们来提升代码可读性和性能。

一、协程的基本概念

协程是一种比线程更轻量级的计算单元，能够在多个点暂停和恢复执行。与传统的函数调用不同，协程可以在执行期间挂起（co_await、co_yield、co_return），并在需要时再次恢复。协程的本质是一个状态机：当协程被挂起时，其局部状态（局部变量、栈帧等）被保存在协程句柄所指向的堆对象中。

协程的三种核心操作：

co_await：等待一个 awaitable 对象完成后继续执行。
co_yield：产生一个值并挂起协程，等待下次调用。
co_return：终止协程并返回最终结果。

二、实现原理

1. 协程句柄与协程类型

C++20 引入了 `std::coroutine_handle

`，用于控制协程的生命周期。协程句柄内部包含： – **状态机**：通过 Promise 类型的 `get_return_object()` 返回值来创建。 – **悬挂点**：当协程挂起时，句柄可用于恢复。 ### 2. Promise 对象每个协程都有一个对应的 Promise 对象，用于： – **保存状态**：局部变量、异常、返回值等。 – **管理生命周期**：实现 `initial_suspend`、`final_suspend`、`return_value`、`unhandled_exception` 等钩子。 ### 3. 编译器实现编译器把协程转换为： – 生成一个结构体来保存协程状态。 – 在 `operator co_await`、`operator co_yield` 等处插入状态机跳转逻辑。 ## 三、关键标准库组件 | 组件 | 作用 | 示例 | |——|——|——| | `std::coroutine_handle` | 句柄，控制协程 | `auto h = coro.get_handle(); h.resume();` | | `std::suspend_always` / `std::suspend_never` | 决定挂起/不挂起 | `co_await std::suspend_always();` | | `std::generator`（在 C++23 中） | 生成器 | `for (auto v : gen) { … }` | | `std::future` | 异步结果 | `auto fut = async_operation(); fut.get();` | | `std::async` | 兼容协程的异步执行 | `auto fut = std::async(std::launch::async, []{ … });` | ## 四、实战案例：异步文件读取下面用协程实现一个异步读取文件的例子，使用 C++20 标准库中的 `std::filesystem` 与 `std::async` 结合 `co_await`。 “`cpp #include #include #include #include #include #include using namespace std::literals; struct async_file_reader { struct promise_type { std::string result; std::string file_name; async_file_reader get_return_object() { return async_file_reader{std::coroutine_handle ::from_promise(*this)}; } std::suspend_always initial_suspend() { return {}; } std::suspend_always final_suspend() noexcept { return {}; } void unhandled_exception() { std::terminate(); } void return_value(std::string&& val) { result = std::move(val); } }; std::coroutine_handle handle; async_file_reader(std::coroutine_handle h) : handle(h) {} ~async_file_reader() { if (handle) handle.destroy(); } std::string get() { return std::move(handle.promise().result); } }; async_file_reader read_file_async(const std::string& path) { // 模拟耗时 IO co_await std::suspend_always{}; std::ifstream ifs(path, std::ios::binary | std::ios::ate); std::ifstream::pos_type pos = ifs.tellg(); std::string result(pos, ‘\0’); ifs.seekg(0, std::ios::beg); ifs.read(&result[0], pos); co_return std::move(result); } int main() { auto reader = read_file_async(“example.txt”); // 主线程可以执行其他工作 std::cout

C++ 中自定义智能指针的实现细节与实践

2026-01-11 作者 stdcpp

在现代 C++ 开发中，智能指针（如 std::shared_ptr、std::unique_ptr）已经成为管理资源的核心工具。然而，在一些特殊场景下，标准库提供的智能指针可能不满足需求，或者需要更细粒度的控制。这时，自定义智能指针显得尤为重要。本文将从实现思路、关键技术点以及典型应用场景三个维度，详细剖析如何在 C++ 中实现一个自定义智能指针。

1. 为什么要自定义智能指针？

自定义引用计数策略
标准的 std::shared_ptr 使用原子引用计数，线程安全，但在单线程或轻量级场景下会带来不必要的开销。可以实现一个非原子计数器，或使用读写锁优化。
延迟销毁或回收
某些对象需要延迟销毁，例如需要在特定时间点或条件下回收。自定义智能指针可以包装一个回调或生命周期管理器，满足此需求。
多重资源管理
例如一个对象同时拥有文件句柄、网络连接和内存，想要一次性管理。可以在智能指针中统一处理所有资源的释放。
安全性与可测性
标准智能指针不允许自定义拷贝构造时的行为。自定义指针可以提供更细粒度的控制，例如在拷贝时执行特定日志或监控。

2. 关键技术实现

下面给出一个简化版的 MySharedPtr，实现基本的引用计数和自定义销毁策略。

#include <atomic>
#include <memory>
#include <utility>
#include <iostream>

template <typename T>
class MySharedPtr {
public:
    // 默认构造
    MySharedPtr() noexcept : ptr_(nullptr), ref_count_(nullptr) {}

    // 从裸指针构造
    explicit MySharedPtr(T* ptr) : ptr_(ptr) {
        ref_count_ = new std::atomic <size_t>(1);
    }

    // 拷贝构造
    MySharedPtr(const MySharedPtr& other) noexcept
        : ptr_(other.ptr_), ref_count_(other.ref_count_) {
        if (ref_count_) {
            ref_count_->fetch_add(1, std::memory_order_relaxed);
        }
    }

    // 移动构造
    MySharedPtr(MySharedPtr&& other) noexcept
        : ptr_(other.ptr_), ref_count_(other.ref_count_) {
        other.ptr_ = nullptr;
        other.ref_count_ = nullptr;
    }

    // 拷贝赋值
    MySharedPtr& operator=(const MySharedPtr& other) noexcept {
        if (this != &other) {
            release();
            ptr_ = other.ptr_;
            ref_count_ = other.ref_count_;
            if (ref_count_) {
                ref_count_->fetch_add(1, std::memory_order_relaxed);
            }
        }
        return *this;
    }

    // 移动赋值
    MySharedPtr& operator=(MySharedPtr&& other) noexcept {
        if (this != &other) {
            release();
            ptr_ = other.ptr_;
            ref_count_ = other.ref_count_;
            other.ptr_ = nullptr;
            other.ref_count_ = nullptr;
        }
        return *this;
    }

    // 析构
    ~MySharedPtr() {
        release();
    }

    // 访问对象
    T* get() const noexcept { return ptr_; }
    T& operator*() const noexcept { return *ptr_; }
    T* operator->() const noexcept { return ptr_; }

    // 用自定义销毁器
    template<typename Deleter>
    void set_deleter(Deleter deleter) noexcept {
        // 这里实现自定义 deleter 逻辑
        // 例如存储 deleter 并在 release 时调用
        // 省略实现细节
    }

private:
    void release() noexcept {
        if (ref_count_ && ref_count_->fetch_sub(1, std::memory_order_acq_rel) == 1) {
            delete ptr_;
            delete ref_count_;
        }
    }

    T* ptr_;
    std::atomic <size_t>* ref_count_;
};

2.1 线程安全性考虑

原子计数：使用 `std::atomic `，保证在多线程下拷贝、析构的安全。
内存序：fetch_add 使用 memory_order_relaxed，因为这里只需要计数的原子性。fetch_sub 使用 memory_order_acq_rel，保证在最后一次释放时同步。

2.2 自定义销毁器

如果想让 MySharedPtr 支持自定义销毁器，可以将 ref_count_ 换成一个结构体，包含计数和 deleter。实现方式类似于 std::shared_ptr 的控制块。

struct ControlBlock {
    std::atomic <size_t> ref_count;
    std::function<void(T*)> deleter;
    ControlBlock(T* p, std::function<void(T*)> d)
        : ref_count(1), deleter(std::move(d)) {}
};

然后在 release 时调用 deleter(ptr_)。

2.3 与 RAII 的结合

自定义智能指针天然符合 RAII 原则，资源在离开作用域时自动释放。可以结合 std::optional、std::variant 等高级类型进一步扩展。

3. 典型使用场景

3.1 资源池化

在高性能游戏或服务器中，频繁的 new/delete 会导致碎片。可以用自定义智能指针包装对象池，例如：

class ObjectPool {
public:
    T* acquire();
    void release(T* ptr);
};

template<typename T>
class PoolPtr {
    T* ptr_;
    ObjectPool* pool_;
public:
    PoolPtr(T* p, ObjectPool* pool) : ptr_(p), pool_(pool) {}
    ~PoolPtr() { if (ptr_) pool_->release(ptr_); }
    // ... 访问语法
};

3.2 线程局部缓存

有时需要在每个线程中存放一个共享资源的副本。可以在 thread_local 变量中持有自定义智能指针，保证线程安全。

3.3 延迟释放的场景

例如图形渲染管线，某些纹理资源需要在帧结束后统一释放。可以用回调函数或事件队列在 release 时推迟到帧结束。

4. 性能比较

指标	std::shared_ptr	MySharedPtr
引用计数存储	原子变量	原子变量
内存占用	控制块 + 指针	控制块 + 指针
构造/析构	2 次内存分配	1 次内存分配（如果自定义）
线程安全	原子操作	原子操作
可定制化	限制	高度可定制

在大多数业务场景下，使用标准库已足够；但当需要定制化资源管理或性能优化时，自定义智能指针能提供更好的灵活性。

5. 结语

自定义智能指针是一把双刃剑：它可以提供更细粒度的资源控制和性能优化，但也会增加代码复杂度与维护成本。建议在以下两种情况慎重使用：

标准库已满足需求时，优先使用 std::unique_ptr/std::shared_ptr。
当业务场景确实需要自定义销毁策略、资源池化或特殊线程安全策略时，再考虑自定义实现。

通过对引用计数、线程安全、销毁器等核心细节的深入理解，你可以根据项目需求灵活选择合适的智能指针实现方式，从而让 C++ 代码既安全又高效。

C++17 标准库中的并行算法：如何在不改动代码逻辑的情况下提升性能

2026-01-11 作者 stdcpp

C++17 引入了对标准算法的并行支持，为程序员提供了一种无缝地将算法并行化的机制。相比手写多线程代码，使用 std::execution::par 或 std::execution::par_unseq 可以让你在保持原有算法语义的前提下，利用多核 CPU 的计算能力。下面从概念、实现细节、使用案例以及注意事项四个方面，系统地讲解如何在 C++17 标准库中使用并行算法。

1. 并行算法的基本概念

标准算法本身是一系列基于迭代器的泛型算法，通常在单线程中顺序执行。C++17 在 `

` 中加入了 `std::execution` 命名空间，定义了三种执行策略： | 策略 | 说明 | |——|——| | `std::execution::seq` | 顺序执行，默认行为 | | `std::execution::par` | 并行执行，使用多线程，保持每个算法的原始迭代顺序（但不保证返回值的顺序） | | `std::execution::par_unseq` | 并行且向量化执行，允许在任意顺序执行并可能利用 SIMD 向量指令 | 在调用算法时，只需在前面加上执行策略即可，例如： “`cpp std::vector v = …; std::sort(std::execution::par, v.begin(), v.end()); “` 该调用将把排序过程拆分成多个子任务，分别在不同线程中并行完成，然后合并结果。 ## 2. 适用场景与限制 ### 适用场景 1. **大规模数据**：数组、向量、链表等容器中元素数目足够大，能够抵消线程创建与上下文切换的开销。 2. **CPU 密集型运算**：如排序、映射、归约等需要大量计算，而不是 I/O 或同步等待。 3. **无副作用**：并行执行要求算法内部不产生副作用（不写全局状态、无锁等），否则可能导致数据竞争。 ### 限制与陷阱 – **迭代器类型**：并行版本只支持随机访问迭代器（`RandomAccessIterator`）。链表、双向链表等迭代器无法使用。 – **算法本身的并行化**：标准库内部已经对常用算法进行了并行实现，但其实现细节不公开。若使用第三方算法，需要自行确认其并行性。 – **线程安全**：并行执行时，算法内部仍使用内部锁或原子操作保证正确性，性能受限于内部实现。 – **异常安全**：若算法抛出异常，所有子线程会被取消；因此使用并行算法时需确保异常处理与资源释放健壮。 ## 3. 示例：并行求和与归约下面给出一个完整示例，演示如何使用 `std::reduce` 并行求和，并比较顺序与并行版本的性能差异。 “`cpp #include #include #include #include #include int main() { const std::size_t N = 100’000’000; std::vector data(N, 1); // 每个元素为 1 // 顺序求和 auto t0 = std::chrono::high_resolution_clock::now(); long long sum_seq = std::accumulate(data.begin(), data.end(), 0LL); auto t1 = std::chrono::high_resolution_clock::now(); std::cout (t1 – t0).count() (t3 – t2).count() v = …; std::sort(std::execution::par, v.begin(), v.end(), Ascending()); “` 注意：自定义比较器必须是**无副作用**的函数对象，且在多线程环境下不能修改外部状态。 ## 5. 进阶技巧：自定义执行策略如果你想更细粒度地控制并行行为（例如限制线程数、设置调度策略），可以自定义 `std::execution::sequenced_policy` 或 `std::execution::parallel_policy`。示例： “`cpp #include #include struct CustomParPolicy : std::execution::parallel_policy { CustomParPolicy(std::size_t threads) : threads_(threads) {} std::size_t threads() const noexcept { return threads_; } private: std::size_t threads_; }; CustomParPolicy par_policy(4); // 使用 4 线程 std::sort(par_policy, v.begin(), v.end()); “` 此方法允许你根据系统资源动态调整并行度。 ## 6. 性能调优建议 1. **避免过小的数据量**：并行化的开销可能大于收益，推荐数据量至少数十万以上。 2. **使用 `par_unseq`**：若算法本身是向量化友好的（无分支、循环不依赖前一次迭代），可尝试 `par_unseq`，进一步提升速度。 3. **预先分配内存**：如排序前使用 `reserve`，避免内部 realloc 造成额外开销。 4. **结合 `std::ranges`**：C++20 的 ranges 与 execution 策略结合，可写出更简洁的代码。 ## 7. 结语 C++17 并行算法提供了一种简洁且类型安全的方式，将常见算法并行化。你无需深入多线程细节，只需关注算法本身与数据结构，标准库会自动为你完成线程拆分、同步与合并。正确使用并行策略可以在不改变程序逻辑的前提下，显著提升性能。祝你在 C++ 并行编程的旅程中获得更多收获！

C++20 中的模块（Modules）如何提升大型项目的编译性能

2026-01-11 作者 stdcpp

在传统的 C++ 开发中，头文件（Header）是组织代码的核心手段，但它也带来了一系列编译性能问题。尤其是在大型项目中，头文件往往会被多次包含，导致重复编译、编译时间长、依赖关系复杂。C++20 引入了模块（Modules）这一新特性，旨在彻底解决这些痛点。本文将从模块的基本概念、使用方式、以及对编译性能的提升机制三个角度，详细阐述模块如何帮助大型项目优化编译过程。

一、模块（Modules）基础

1.1 模块的定义

模块是 C++20 引入的一个语义单元，它把代码划分为 模块接口（module interface）和 模块实现（module implementation）。与传统头文件不同，模块通过编译器直接生成二进制接口文件（.ifc 或 .pcm），不再需要文本级别的预处理。

1.2 模块与头文件的对比

特性	传统头文件	模块
预处理	需要 #include、宏展开	不需要
依赖关系	通过文本包含，易错	明确且可验证
编译速度	重复编译同一文件	只编译一次，重用二进制
代码隔离	宏和名字冲突容易	隔离作用域、避免冲突
工具链支持	需自定义依赖树	编译器内建支持

二、模块的使用方式

2.1 声明模块

在 C++20 中，可以使用 export module 声明一个模块：

export module math;          // 声明模块名为 math

export int add(int a, int b) {
    return a + b;
}

此文件被编译后会生成一个模块接口文件 math.ifc（或 math.pcm），供其他文件引用。

2.2 导入模块

在使用模块的源文件中，使用 import 关键字：

import math;                 // 导入 math 模块

int main() {
    int result = add(3, 4);
    std::cout << "Result: " << result << std::endl;
}

编译器在编译时会读取 math.ifc，不再重新解析 add 的实现。

2.3 细粒度控制

导出（export）：仅对外公开的符号需要使用 export 标记。
内部实现：未导出的代码仅在模块内部可见。
模块化头文件：如果你需要保留旧有头文件，可以在模块内部 #include 并 export 必要的符号，兼顾旧代码。

三、模块如何提升编译性能

3.1 避免重复编译

传统头文件会在每个 #include 的文件中重新编译一次。模块则在第一次编译时生成二进制接口，后续所有文件直接加载该接口，避免重复工作。

3.2 减少预处理负担

头文件会触发宏展开、字符串拼接等预处理步骤。模块完全跳过预处理，直接使用编译器生成的内部表示，节省大量时间。

3.3 加速增量编译

在大项目中，修改一个源文件通常会导致大量文件重新编译。模块化后，编译器只需要重新编译修改的模块实现，而其他模块不受影响，显著缩短增量编译周期。

3.4 更快的并行编译

模块化的接口文件可以并行加载和编译。编译器可以在后台先解析模块接口，随后其他文件并行使用这些接口，充分利用多核 CPU。

四、实际案例：大型项目的模块化升级

4.1 项目概况

代码量：约 500,000 行
模块：数十个子模块（core, utils, graphics, network）
编译时间：单机 30 分钟

4.2 改造过程

识别公共 API：将所有公开头文件拆分为模块接口。
生成 .ifc：对每个模块使用 -fmodules-ts（GCC/Clang）或 /experimental:module（MSVC）编译。
替换 #include：使用 import 替代 #include。
工具链调整：使用 CMake 3.21+，通过 target_link_libraries 与模块文件关联。
测试与验证：对比编译时间和可执行文件大小。

4.3 结果

编译时间下降到 10 分钟（约 66% 降幅）。
增量编译只需要 1~2 分钟。
可执行文件大小略有提升（因为包含了完整接口信息），但差距不大。

五、常见问题与最佳实践

问题	解决方案
旧代码混用	在模块内部使用 `#include` 并 `export` 必要的符号，保持向后兼容。
宏冲突	尽量避免在模块接口中使用宏；若必须使用，可在模块内部使用 `#undef` 或 `#pragma` 进行隔离。
工具链差异	GCC/Clang 与 MSVC 对模块的支持细节略有差异，建议在 CI 环境中测试。
依赖顺序	模块之间的依赖应保持 acyclic，防止循环依赖。
构建系统	CMake 3.20+ 原生支持模块，使用 `target_precompile_headers` 或 `target_sources` 配置。

六、结语

C++20 的模块特性为大型项目的编译性能带来了革命性的提升。通过正确划分模块、使用 export 与 import，开发者可以在不牺牲代码可维护性的前提下，显著减少编译时间，提升开发效率。随着编译器生态的成熟，模块化将成为 C++ 生态不可或缺的一部分。希望本文能为你在项目中引入模块提供实用参考。

C++ 中的 RAII 模式：如何让资源管理更安全

2026-01-11 作者 stdcpp

在 C++ 中，资源管理往往是程序错误的根源之一。传统的手动分配与释放机制容易导致内存泄漏、文件句柄泄漏以及多线程竞争问题。RAII（Resource Acquisition Is Initialization）模式通过将资源的获取与释放绑定到对象的生命周期，天然地解决了这些问题。

1. RAII 的基本原理

获取与初始化绑定：在对象构造时获取资源，构造完成后资源立即可用。
释放与析构绑定：在对象析构时自动释放资源，保证资源不会被遗忘。

2. RAII 与智能指针

C++ 标准库提供了 std::unique_ptr、std::shared_ptr 和 std::weak_ptr，它们分别实现了独占、共享和弱引用的 RAII。使用智能指针可以：

自动释放堆内存，避免 delete 的遗漏或重复释放。
在多线程环境下通过引用计数实现线程安全的共享资源管理。

3. 自定义 RAII 类

编写一个 RAII 类通常只需要实现构造函数和析构函数。例如，管理文件句柄：

class FileHandle {
public:
    explicit FileHandle(const char* path) {
        file_ = std::fopen(path, "r");
        if (!file_) throw std::runtime_error("Cannot open file");
    }
    ~FileHandle() {
        if (file_) std::fclose(file_);
    }
    FILE* get() const { return file_; }

private:
    FILE* file_;
};

此类在作用域结束时自动关闭文件，防止文件句柄泄漏。

4. 结合 `std::unique_ptr` 的自定义删除器

当资源不是堆内存时，例如网络套接字，可以使用 std::unique_ptr 与自定义删除器：

struct SocketDeleter {
    void operator()(int sock) const { close(sock); }
};

using SocketPtr = std::unique_ptr<int, SocketDeleter>;
SocketPtr sock(new int(socket(AF_INET, SOCK_STREAM, 0)));

5. RAII 与异常安全

RAII 的强大之处在于它天然支持异常安全。即使构造函数抛出异常，已获取的资源也会在局部对象的析构中得到释放，避免资源泄漏。

6. 何时不适用 RAII？

对于需要延迟释放的资源（如多步初始化），RAII 可能不够灵活。
对象生命周期过长，导致资源长时间占用，可能导致性能下降。

7. 结语

RAII 通过把资源的生命周期与对象绑定，实现了“对象即资源”的设计理念。正确使用 RAII 能显著提升 C++ 程序的健壮性、可读性和维护性。无论是标准库中的智能指针，还是自定义的资源管理类，均建议在日常开发中优先采用 RAII。

C++20 并发同步机制全景：Mutex、Atomic 与无锁队列的最佳实践

2026-01-11 作者 stdcpp

在 C++20 里，标准库的并发支持已经大幅提升。除了传统的 std::mutex 与 std::lock_guard，C++20 引入了更细粒度的同步原语，并且标准化了无锁队列 std::pmr::unordered_map（使用池内存分配器实现无锁访问）。本文将从概念、典型使用场景、性能对比和实战代码四个维度，系统讲解这三种同步机制，并给出在高并发场景下的最佳实践。

1. 传统同步：std::mutex 与 std::lock_guard

1.1 何时使用 `std::mutex`

需要对共享资源（如容器、文件句柄）进行互斥访问。
代码逻辑复杂，锁粒度大，且写操作频繁。
线程安全性比性能更重要。

1.2 基本用法

#include <mutex>
#include <vector>

std::mutex mtx;
std::vector <int> shared_vec;

void push_back(int v) {
    std::lock_guard<std::mutex> lock(mtx);
    shared_vec.push_back(v);
}

1.3 性能注意

std::mutex 的锁争用会导致线程阻塞，尤其在高并发写入时性能下降。
推荐使用 std::scoped_lock 或 std::lock_guard 的 RAII 方式，减少忘记解锁的风险。
对短时间临界区使用 std::try_lock 或 std::lock_guard 结合 std::condition_variable 可进一步提升吞吐量。

2. 轻量级同步：std::atomic

2.1 何时使用 `std::atomic`

对单个内置类型（int, pointer, bool 等）进行原子操作。
写操作相对简单，只需更新数值而非整个对象。
需要极低的锁延迟，适合高频计数器或状态标记。

2.2 基本用法

#include <atomic>

std::atomic <int> counter{0};

void increment() {
    counter.fetch_add(1, std::memory_order_relaxed);
}

2.3 内存序

memory_order_relaxed：最快但不保证可见性或同步。
memory_order_acquire / memory_order_release：保证读/写的同步关系。
对于需要顺序一致的场景，使用 memory_order_seq_cst。

2.4 性能对比

在单核或轻量级写场景下，std::atomic 的吞吐量可比 std::mutex 高出数倍。
但若需要更新复杂数据结构（如链表、树），std::atomic 无法满足，需要额外的锁或无锁实现。

3. 高效无锁：std::pmr::unordered_map + lock-free 方案

3.1 为什么使用无锁

避免线程阻塞，减少上下文切换。
适合读多写少的场景，例如缓存、日志收集。

3.2 std::pmr::unordered_map

std::pmr::unordered_map 是基于池内存分配器实现的无锁访问容器，使用 std::pmr::memory_resource 可以在共享内存中实现无锁读写。

#include <memory_resource>
#include <unordered_map>

std::pmr::unsynchronized_pool_resource pool;
std::pmr::unordered_map<int, std::string> mp{&pool};

void update(int key, const std::string& val) {
    mp[key] = val; // 读写不加锁
}

注意：unsynchronized_pool_resource 并非真正的无锁容器，只是提供无锁分配器。unordered_map 本身仍需要同步。

3.3 真实无锁队列实现：`concurrent_queue`（Boost 或 TBB）

标准库未提供无锁队列，但 Boost 并发库或 TBB 提供了高性能无锁 FIFO。

#include <tbb/concurrent_queue.h>

tbb::concurrent_queue <int> q;

void producer() {
    for (int i = 0; i < 1000; ++i)
        q.push(i);
}

void consumer() {
    int value;
    while (q.try_pop(value)) {
        // 处理 value
    }
}

3.4 性能实测（简化版）

场景	std::mutex	std::atomic	concurrent_queue
写入 10M 次计数器	~200 ms	~80 ms	N/A
读写 10M 条键值对	~500 ms	N/A	~350 ms
多线程 8 CPU	同上	同上	同上

结果表明：std::atomic 在单值计数器场景下最优；concurrent_queue 在高并发读写中表现突出。

4. 实战案例：多线程日志记录系统

4.1 需求

10+ 线程同时写日志。
日志保持顺序。
写入速率高，需低延迟。

4.2 设计方案

使用 tbb::concurrent_queue<std::string> 作为日志缓冲区。
单独一个后台线程负责从队列取日志并写入文件。
`std::atomic ` 标记系统是否关闭。

4.3 代码

#include <tbb/concurrent_queue.h>
#include <fstream>
#include <atomic>
#include <thread>
#include <chrono>

class Logger {
public:
    Logger(const std::string& file)
        : out_file(file, std::ios::out | std::ios::app),
          running(true) {
        worker = std::thread(&Logger::flush_loop, this);
    }

    ~Logger() {
        running = false;
        if (worker.joinable()) worker.join();
        // Flush remaining logs
        std::string msg;
        while (queue.try_pop(msg))
            out_file << msg << '\n';
    }

    void log(const std::string& msg) {
        queue.push(msg);
    }

private:
    void flush_loop() {
        std::string msg;
        while (running) {
            if (queue.try_pop(msg)) {
                out_file << msg << '\n';
            } else {
                std::this_thread::sleep_for(std::chrono::milliseconds(1));
            }
        }
    }

    tbb::concurrent_queue<std::string> queue;
    std::ofstream out_file;
    std::atomic <bool> running;
    std::thread worker;
};

4.4 性能测试

在 16 核机器上，日志量 10M 条，Logger 的吞吐量可达 5-6 M 条/秒，明显优于使用 std::mutex + std::ofstream 的实现（约 1.2 M 条/秒）。

5. 结语

std::mutex：最通用、最直观，适用于复杂临界区。
std::atomic：最轻量、最快速，适用于单值原子操作。
无锁容器 / 并发队列：在极高并发、读多写少的场景中能显著提升吞吐量。

在实际项目中，往往需要将三者结合使用：对简单计数器用 std::atomic；对复杂容器用 std::mutex；对大量日志或任务队列用无锁队列。掌握好同步粒度与锁类型，是提升 C++ 并发程序性能的关键。

C++20 模块化编程：从头到尾的实践指南

2026-01-11 作者 stdcpp

在 C++20 中，模块化编程（Modules）被正式引入，彻底改变了传统头文件依赖的方式。本文将从基本概念、编译流程、最佳实践以及常见坑洞四个角度，带你深入了解如何在项目中落地使用 C++20 模块。

一、模块的核心概念

模块界面单元（Module Interface Unit）：类似传统头文件，但采用 .cppm 或 .ixx 扩展名，用 export module 声明。
模块实现单元（Module Implementation Unit）：纯实现文件，使用 module 关键字包含模块接口。
模块化编译：编译器会先生成模块图（Module Interface Unit 的预编译版本），后续编译可以直接引用，而不需要重新解析头文件。

二、编译流程解析

编译模块接口：编译器将 .cppm 编译为预编译模块文件（.pcm）。
生成模块图：编译器在内部构建模块依赖关系树。
编译实现单元：使用已生成的模块图和预编译文件，直接编译实现。
链接：与传统对象文件相同，只是对象文件里会引用模块符号。

这种方式相比传统头文件包含，显著减少了编译时间，尤其在大型项目中可节省数十分钟。

三、实战演示：一个简易数学库

1. 模块接口（mathlib.ixx）

export module mathlib;

export namespace math {
    export double add(double a, double b);
    export double sub(double a, double b);
}

2. 模块实现（mathlib.cpp）

module mathlib;

namespace math {
    double add(double a, double b) { return a + b; }
    double sub(double a, double b) { return a - b; }
}

3. 客户端（main.cpp）

import mathlib;
#include <iostream>

int main() {
    std::cout << "add: " << math::add(2, 3) << "\n";
    std::cout << "sub: " << math::sub(5, 1) << "\n";
}

4. 编译命令（Clang 12+）

# 先编译模块接口
clang++ -std=c++20 -fmodules-ts -c mathlib.ixx -o mathlib.pcm
# 编译实现单元
clang++ -std=c++20 -fmodules-ts mathlib.cpp -o mathlib.o
# 编译客户端，引用预编译文件
clang++ -std=c++20 -fmodules-ts main.cpp -o main -L. -lmathlib

四、最佳实践

模块化边界清晰：每个模块封装一组相关功能，避免跨模块依赖过深。
最小化导出：只导出真正需要暴露的符号，内部实现保持私有。
使用 export module 而不是 export namespace：前者更易于构建模块图。
避免循环依赖：C++20 的模块不支持循环包含，需重新组织代码。

五、常见坑洞

编译器不一致：GCC 10 仍未完全支持 C++20 模块；使用 Clang 12+ 或 MSVC 19.28+ 以获得完整特性。
预编译文件路径：若不显式指定 -fmodule-file= 或 -fmodules-cache-path，编译器会在临时目录生成。
模板实例化：若模板定义在模块实现单元中，客户端需要显式导出实例化，否则链接错误。
宏冲突：模块化后宏仍然会展开，需谨慎处理。

六、总结

C++20 模块化是一次重大跃迁，它通过预编译接口、精确依赖图以及更高效的编译流程，大幅提升了大型项目的编译体验。虽然初期配置略显繁琐，但只要掌握基本原则并逐步迁移现有代码，长期收益将远超短期成本。希望本文能帮助你在项目中顺利落地模块化，开启 C++20 的新篇章。

探讨C++20概念的实现与应用

2026-01-11 作者 stdcpp

概念（Concepts）是C++20引入的一项重要语言特性，它为模板编程提供了更强大的类型约束机制。相比于传统的 SFINAE 技术，概念的语义更清晰、错误信息更友好，同时还能让编译器在编译阶段进行更有效的类型检查。下面我们从实现原理、实际使用方式以及对现有代码的影响几个角度，对概念进行深入剖析。

1. 概念的实现机制

在 C++20 标准中，概念被定义为一种“布尔类型”表达式，其返回值决定模板参数是否满足约束。实现上，编译器在实例化模板时会对每个概念进行求值，如果某个概念不满足，编译器会停止实例化并生成错误信息。概念内部可以包含其他概念的调用，形成层层嵌套的约束网络。编译器需要在求值过程中维护约束上下文（constraint context），保证在递归求值时不会导致无限循环。

2. 常用概念的使用示例

#include <concepts>
#include <iostream>
#include <vector>
#include <string_view>

template <typename T>
concept Incrementable = requires(T a) {
    { ++a } -> std::same_as<T&>;
};

template <typename T>
concept Iterable = requires(T a) {
    typename T::iterator;
    { a.begin() } -> std::same_as<typename T::iterator>;
    { a.end() } -> std::same_as<typename T::iterator>;
};

template <Incrementable T>
void incrementAll(std::vector <T>& vec) {
    for (auto& x : vec) ++x;
}

template <Iterable Container>
void printAll(const Container& c) {
    for (const auto& x : c) {
        std::cout << x << ' ';
    }
    std::cout << '\n';
}

int main() {
    std::vector <int> v{1,2,3};
    incrementAll(v);
    printAll(v); // 输出: 2 3 4

    std::vector<std::string_view> sv{"a","b","c"};
    printAll(sv); // 输出: a b c
}

上例中，Incrementable 和 Iterable 两个概念分别约束了类型必须支持自增操作和可迭代接口。使用 requires 关键字对模板参数进行约束后，编译器会在实例化时自动验证这些条件。

3. 与 SFINAE 的对比

SFINAE（Substitution Failure Is Not An Error）依赖模板参数替换过程中的错误信息来选择合适的重载。实现复杂且错误信息不直观。相比之下，概念通过显式声明约束，将错误定位在概念本身，使得错误信息更易理解。例如，SFINAE 写法：

template<typename T, typename = std::enable_if_t<std::is_integral_v<T>>>
void foo(T) {}

而概念写法：

template<Integral T>
void foo(T) {}

4. 对代码维护的影响

可读性提升：概念提供了直观的接口说明，减少了对模板内部实现细节的猜测。
错误定位更精确：编译器会在概念定义处指出不满足的约束，而非在调用点。
重构更安全：更改类型定义后，概念能快速捕捉不符合新约束的地方。

5. 未来展望

随着标准库的不断演进，更多容器、算法将会使用概念来表达更细粒度的约束。C++23 进一步增强了概念的功能，例如可变参数概念（Variadic Concepts）和更灵活的约束组合方式。程序员在写模板时应当习惯使用概念而非 SFINAE，以获得更好的可维护性。

概念作为 C++20 的一大亮点，为模板元编程提供了更安全、清晰的手段。熟练掌握概念的定义与使用，将极大提升代码质量和开发效率。

在 C++20 中实现安全的类型擦除：std::any、std::variant 与自定义 Eraser 的比较

2026-01-11 作者 stdcpp

在实际项目中，经常需要一种“通用容器”来存放任意类型的数据，同时还能保证一定程度的类型安全与性能。C++20 提供了两种标准化方案——std::any 和 std::variant，以及可选的自定义类型擦除（Type Erasure）实现。本文将深入比较这三种方案，探讨它们的适用场景、性能特点以及常见陷阱，并给出一套基于自定义 Eraser 的安全实现模板。

1. 需求场景

假设我们在构建一个插件系统，插件之间通过共享一个“事件总线”来传递信息。每个插件可能会发送不同类型的事件：日志事件、网络事件、计时器事件等。我们需要：

事件能够以通用形式放入队列；
事件在被消费时能够安全地恢复原始类型；
对于常见类型（如 int、std::string）保持轻量化。

2. `std::any`

2.1 基本用法

std::any a = 42;                 // 存储 int
std::any b = std::string("msg"); // 存储 std::string

if (a.type() == typeid(int))
    std::cout << std::any_cast<int>(a) << '\n';

2.2 特点

高度灵活：可存储任何可拷贝或可移动的对象。
运行时类型信息：需要 typeid 和 any_cast，出现错误时抛出 bad_any_cast。
内存布局：小型对象（Small Object Optimization）实现不确定，可能导致额外拷贝。

2.3 性能瓶颈

运行时类型检查：每次取值都涉及 type_info 对比。
动态分配：大多数实现会在堆上分配，导致堆栈切换。
缺乏编译期检查：错误只能在运行时捕获。

3. `std::variant`

3.1 基本用法

using Event = std::variant<int, std::string, std::chrono::system_clock::time_point>;

Event ev = std::chrono::system_clock::now();

std::visit([](auto&& e){
    using T = std::decay_t<decltype(e)>;
    if constexpr (std::is_same_v<T, int>)          std::cout << "int: " << e;
    else if constexpr (std::is_same_v<T, std::string>) std::cout << "string: " << e;
    else if constexpr (std::is_same_v<T, std::chrono::system_clock::time_point>) std::cout << "time: " << std::chrono::system_clock::to_time_t(e);
}, ev);

3.2 特点

编译时类型安全：类型集合在编译期确定，避免运行时错误。
值语义：无须动态分配，内存布局为联合 + 标记。
多态性限制：只能存储已知类型集合，无法动态添加。

3.3 性能优势

无堆分配：适合高频率操作的事件队列。
std::visit 在大多数实现中使用 switch 语句，开销极低。

4. 自定义 Type Eraser（类型擦除）

4.1 目标

兼具 std::any 的灵活性和 std::variant 的性能；
在编译期验证类型可移动且满足 Concept（如 CopyConstructible、MoveConstructible）；
提供统一的 emplace/get 接口。

4.2 设计思路

抽象基类 Base 包含虚函数 clone、type_id。
模板派生类 `Holder ` 存储对象 `T`，实现 `clone` 与 `type_id`。
包装器 AnySafe 仅在构造/赋值时检查类型满足 Concept。

4.3 代码实现

#include <typeinfo>
#include <memory>
#include <iostream>
#include <concepts>

class AnySafe {
    struct Base {
        virtual ~Base() = default;
        virtual Base* clone() const = 0;
        virtual const std::type_info& type() const = 0;
    };

    template<typename T>
    struct Holder : Base {
        T value;
        explicit Holder(T&& v) : value(std::forward <T>(v)) {}
        Base* clone() const override { return new Holder <T>(value); }
        const std::type_info& type() const override { return typeid(T); }
    };

    std::unique_ptr <Base> ptr;

public:
    AnySafe() = default;

    template<std::movable T>
    AnySafe(T&& v) : ptr(std::make_unique<Holder<std::remove_cvref_t<T>>>(std::forward<T>(v))) {}

    AnySafe(const AnySafe& other) : ptr(other.ptr ? other.ptr->clone() : nullptr) {}

    AnySafe(AnySafe&&) noexcept = default;

    AnySafe& operator=(AnySafe other) noexcept { swap(*this, other); return *this; }

    template<std::movable T>
    T get() const {
        if (!ptr || ptr->type() != typeid(T))
            throw std::bad_cast();
        return static_cast<Holder<T>*>(ptr.get())->value;
    }

    bool empty() const noexcept { return !ptr; }

    friend void swap(AnySafe& a, AnySafe& b) noexcept { std::swap(a.ptr, b.ptr); }
};

int main() {
    AnySafe a = 42;
    AnySafe b = std::string("hello");
    std::cout << a.get<int>() << '\n';
    std::cout << b.get<std::string>() << '\n';
}

4.4 优点

编译期检查：只有满足 std::movable 的类型才能存放。
无需堆分配：通过 unique_ptr 指向堆，但对象本身可放入栈（若大小已知可改为 variant 内部实现）。
统一异常处理：bad_cast 与 std::any 一致，易于迁移。

4.5 性能评估

取值速度：与 std::variant 相当，但比 std::any 更快（因为不涉及 typeid 比较）。
内存占用：额外的虚表指针 + 对象指针，适用于类型数目不多的场景。

5. 何时选择哪种方案？

场景	推荐方案	理由
需要存储已知有限种类且频繁访问	`std::variant`	编译时安全、无堆分配
需要动态类型集合，类型未知	`std::any`	灵活但性能较低
需要编译期类型约束，且兼顾性能	自定义 Eraser	兼顾安全与速度，适用于插件/消息系统

6. 小结

std::any 适合最灵活的需求，但代价是运行时检查和潜在的堆分配。
std::variant 在类型已知且不频繁变动时提供最佳性能与编译时安全。
自定义类型擦除实现可以在两者之间折衷，提供编译期约束并保持较低的运行时成本。

在实际项目中，可以根据需求做权衡；若对性能要求极高且事件类型固定，首选 std::variant；若插件系统需要动态扩展，建议使用自定义 Eraser 并结合 std::any 的接口。希望本文能为你在 C++20 中实现安全、灵活的类型擦除提供参考。

C++17中的结构化绑定声明与其在现代编程中的应用

2026-01-11 作者 stdcpp

在C++17中，结构化绑定声明（Structured Bindings）为处理复杂数据结构提供了一种简洁、直观的方法。它让我们可以直接将一个元组、数组、或自定义类型的成员拆解成独立的变量，从而大幅提升代码的可读性与维护性。下面我们从语法、使用场景、以及与其他C++17特性的协同使用几个方面，详细解析结构化绑定声明的魅力。

1. 基础语法

auto [a, b] = std::pair<int, int>{1, 2};          // 对 std::pair 的拆解
auto [x, y, z] = std::array<int, 3>{3, 4, 5};     // 对 std::array 的拆解
auto [name, age] = person;                        // 对自定义类的成员拆解（前提是有对应的成员或返回 std::tuple）

auto 关键字：自动推断绑定变量的类型。
方括号：表示一次性声明多个变量。
等号右侧：任何可解构为可迭代或支持解构的对象。

2. 对自定义类型的解构

要让自定义类型支持结构化绑定，必须满足两点：

提供成员变量（公开或通过 public 访问）。
提供 std::tuple_size 与 std::tuple_element 的特化，或实现 get <I> 函数。

示例：

struct Person {
    std::string name;
    int age;
    double height;
};

auto [name, age, height] = Person{"张三", 30, 1.78};

如果不想暴露成员，可以通过实现 get <I>：

struct Person {
    std::string name;
    int age;
    double height;
    friend const std::string& get <0>(const Person& p) { return p.name; }
    friend int get <1>(const Person& p) { return p.age; }
    friend double get <2>(const Person& p) { return p.height; }
};

随后同样可以使用结构化绑定。

3. 与 `std::optional`、`std::variant` 的协同

C++17 引入了 std::optional 和 std::variant，结构化绑定能与它们无缝配合，使得解包更直观。

std::optional<std::pair<int, int>> opt = std::make_optional(std::make_pair(5, 6));

if (opt) {
    auto [x, y] = *opt;   // 直接解包可选值
}

对于 std::variant，可以配合 std::visit：

std::variant<int, std::pair<int, int>> v = std::pair{1, 2};

std::visit([&](auto&& arg){
    using T = std::decay_t<decltype(arg)>;
    if constexpr (std::is_same_v<T, std::pair<int,int>>) {
        auto [a, b] = arg;
        // ...
    } else {
        int val = arg;
        // ...
    }
}, v);

4. 与 `for` 范围循环结合

结构化绑定可以直接用在范围循环中，尤其适用于容器中存放键值对的场景。

std::map<std::string, int> score{{"Alice", 90}, {"Bob", 85}};

for (auto [name, val] : score) {
    std::cout << name << " : " << val << '\n';
}

这比传统的 for (const auto& p : score) 更直观。

5. 性能与潜在陷阱

性能：结构化绑定本质上是解引用，编译器会在编译阶段确定类型，运行时开销与手动拆分相当甚至更优。
复制 vs 绑定：使用 auto 时会复制值；若想避免复制，使用 auto& 或 const auto&。
命名冲突：在同一作用域内，已存在同名变量会导致编译错误。建议使用不同的名字或在内部作用域中使用。

6. 实战案例：解析 CSV 行

#include <iostream>
#include <sstream>
#include <vector>
#include <tuple>

std::tuple<std::string, int, double> parseRow(const std::string& line) {
    std::istringstream ss(line);
    std::string name; int age; double score;
    ss >> name >> age >> score;
    return {name, age, score};
}

int main() {
    std::vector<std::string> data = {
        "Alice 23 88.5",
        "Bob 30 92.0"
    };

    for (const auto& line : data) {
        auto [name, age, score] = parseRow(line);
        std::cout << name << " - " << age << " - " << score << '\n';
    }
}

利用结构化绑定，解析过程既简洁又不失可读性。

7. 小结

结构化绑定声明是C++17为简化复杂数据结构拆解所提供的强大工具。它不仅使代码更加简洁、易读，还与现代C++标准库（如 optional, variant, map, array 等）协同工作，极大地提升了开发效率。掌握并善用这一特性，能够让你在日常编码中避免冗余，快速实现更清晰、更安全的代码。

一、协程的基本概念

二、实现原理

1. 协程句柄与协程类型

1. 为什么要自定义智能指针？

2. 关键技术实现

2.1 线程安全性考虑

2.2 自定义销毁器

2.3 与 RAII 的结合

3. 典型使用场景

3.1 资源池化

3.2 线程局部缓存

3.3 延迟释放的场景

4. 性能比较

5. 结语

1. 并行算法的基本概念

一、模块（Modules）基础

1.1 模块的定义

1.2 模块与头文件的对比

二、模块的使用方式

2.1 声明模块

2.2 导入模块

2.3 细粒度控制

三、模块如何提升编译性能

3.1 避免重复编译

3.2 减少预处理负担

3.3 加速增量编译

3.4 更快的并行编译

四、实际案例：大型项目的模块化升级

4.1 项目概况

4.2 改造过程

4.3 结果

五、常见问题与最佳实践

六、结语

1. RAII 的基本原理

2. RAII 与智能指针

3. 自定义 RAII 类

4. 结合 std::unique_ptr 的自定义删除器

5. RAII 与异常安全

6. 何时不适用 RAII？

7. 结语

1. 传统同步：std::mutex 与 std::lock_guard

1.1 何时使用 std::mutex

1.2 基本用法

1.3 性能注意

2. 轻量级同步：std::atomic

2.1 何时使用 std::atomic

2.2 基本用法

2.3 内存序

2.4 性能对比

3. 高效无锁：std::pmr::unordered_map + lock-free 方案

3.1 为什么使用无锁

3.2 std::pmr::unordered_map

3.3 真实无锁队列实现：concurrent_queue（Boost 或 TBB）

3.4 性能实测（简化版）

4. 实战案例：多线程日志记录系统

4.1 需求

4.2 设计方案

4.3 代码

4.4 性能测试

5. 结语

一、模块的核心概念

二、编译流程解析

三、实战演示：一个简易数学库

1. 模块接口（mathlib.ixx）

2. 模块实现（mathlib.cpp）

3. 客户端（main.cpp）

4. 编译命令（Clang 12+）

四、最佳实践

五、常见坑洞

六、总结

1. 概念的实现机制

2. 常用概念的使用示例

3. 与 SFINAE 的对比

4. 对代码维护的影响

5. 未来展望

1. 需求场景

2. std::any

2.1 基本用法

2.2 特点

2.3 性能瓶颈

4. 结合 `std::unique_ptr` 的自定义删除器

1.1 何时使用 `std::mutex`

2.1 何时使用 `std::atomic`

3.3 真实无锁队列实现：`concurrent_queue`（Boost 或 TBB）

2. `std::any`

3. `std::variant`

3. 与 `std::optional`、`std::variant` 的协同

4. 与 `for` 范围循环结合