standrad c++ – 第 165 页

C++ 中的 RAII 原则及其在资源管理中的应用

2026-01-14 作者 stdcpp

在现代 C++ 开发中，RAII（Resource Acquisition Is Initialization）原则是保证资源安全、避免泄漏的核心技术。它的核心思想是：在对象构造时获取资源，在对象析构时释放资源，从而把资源生命周期与对象生命周期绑定。通过 RAII，程序员可以专注于业务逻辑，而无需担心手动释放资源导致的错误。

1. RAII 的基本概念

资源获取：在构造函数中进行资源分配，例如打开文件、分配内存、锁定互斥量等。
资源释放：在析构函数中自动回收资源。由于 C++ 的对象生命周期管理，析构函数会在对象离开作用域或被显式销毁时被调用。

RAII 的典型例子包括：

std::unique_ptr、std::shared_ptr 对象管理动态内存。
std::fstream 打开文件后在析构时自动关闭。
std::lock_guard 自动加锁并在析构时解锁。

2. RAII 的实现要点

资源封装
将裸资源包装在类内部，避免外部直接访问。

class FileHandle {
    FILE* fp_;
public:
    explicit FileHandle(const char* path, const char* mode) {
        fp_ = fopen(path, mode);
        if (!fp_) throw std::runtime_error("Open file failed");
    }
    ~FileHandle() {
        if (fp_) fclose(fp_);
    }
    FILE* get() const { return fp_; }
};

不可复制可移动
资源管理类通常应禁用复制构造和赋值运算符，允许移动构造和移动赋值，以避免双重释放。

FileHandle(const FileHandle&) = delete;
FileHandle& operator=(const FileHandle&) = delete;
FileHandle(FileHandle&& other) noexcept : fp_(other.fp_) { other.fp_ = nullptr; }
FileHandle& operator=(FileHandle&& other) noexcept {
    if (this != &other) {
        if (fp_) fclose(fp_);
        fp_ = other.fp_;
        other.fp_ = nullptr;
    }
    return *this;
}

异常安全
RAII 的最大优势是异常安全。因为资源在构造时获取，析构时释放，无论异常是否发生，资源都会被正确处理。

3. RAII 在多线程中的应用

3.1 互斥量

std::mutex mtx;
{
    std::lock_guard<std::mutex> lock(mtx); // 自动加锁
    // 临界区代码
} // lock 自动解锁

3.2 条件变量

std::condition_variable cv;
std::unique_lock<std::mutex> lk(mtx);
cv.wait(lk, []{ return ready; }); // 等待时自动解锁，条件满足后重新加锁

3.3 原子计数器的 RAII 包装

class RefCounter {
    std::atomic <int>* counter_;
public:
    explicit RefCounter(std::atomic <int>* cnt) : counter_(cnt) { ++*counter_; }
    ~RefCounter() { --*counter_; }
};

4. RAII 的高级用例

4.1 资源池与 RAII

将连接池、内存池等资源管理与 RAII 结合，可以实现更细粒度的资源释放。

class ConnectionPool {
public:
    std::shared_ptr <Connection> acquire() {
        // 取出可用连接并包装在 shared_ptr 中
    }
};

4.2 事务管理

在数据库编程中，事务可以用 RAII 方式保证提交或回滚。

class Transaction {
    DBConnection& db_;
    bool committed_;
public:
    explicit Transaction(DBConnection& db) : db_(db), committed_(false) {
        db_.beginTransaction();
    }
    void commit() { db_.commit(); committed_ = true; }
    ~Transaction() {
        if (!committed_) db_.rollback();
    }
};

5. 可能的陷阱与注意事项

循环依赖：当两个 RAII 对象互相持有指针时，析构顺序可能导致野指针。
移动语义错误：不正确的移动实现可能导致资源被错误地复用。
性能开销：虽然 RAII 让代码更安全，但有时会带来轻微的性能损耗，如额外的堆分配。通常可以通过 std::unique_ptr 的 defer_lock 或 std::scoped_lock 等方式减小开销。

6. 小结

RAII 是 C++ 中实现异常安全和资源管理的强大工具。通过正确封装资源、禁用复制、实现移动语义，并结合现代标准库的 RAII 对象（如 smart pointers、lock_guard 等），可以大幅度降低内存泄漏、文件泄漏、锁死等错误的概率。掌握 RAII 的使用，能够让 C++ 开发者编写出更健壮、易维护的代码。

如何在C++中实现线程安全的单例模式？

2026-01-14 作者 stdcpp

单例模式（Singleton Pattern）是一种常用的设计模式，用于保证某个类在整个程序中只产生一次实例，并提供全局访问点。在多线程环境下，若不加以控制，可能导致多线程同时创建多个实例，破坏单例性质。下面介绍几种在C++中实现线程安全单例的常见方法，并分析其优缺点。

1. 经典的 `Meyers` 单例（C++11 之后天然线程安全）

class Singleton {
public:
    static Singleton& instance() {
        static Singleton instance;  // C++11 之后，局部静态变量初始化是线程安全的
        return instance;
    }
    // 删除拷贝构造和赋值操作
    Singleton(const Singleton&) = delete;
    Singleton& operator=(const Singleton&) = delete;

private:
    Singleton() = default;
    ~Singleton() = default;
};

原理

通过函数内部的 static 局部变量实现懒加载（第一次调用时才创建实例）。
C++11 规定，局部静态变量的初始化是原子操作，且只执行一次，因此即使多个线程同时进入 instance()，也只会产生一个实例。

优点

代码简洁，易于维护。
无需手动加锁，避免了锁竞争和死锁风险。
延迟加载，首次使用才创建实例，节省资源。

缺点

对旧编译器（C++03）不兼容。
若想在单例销毁前做特定操作（如日志），需要额外设计。

2. 双重检查锁（Double-Check Locking）

class Singleton {
public:
    static Singleton* instance() {
        if (!ptr_) {                    // 第一次检查（无锁）
            std::lock_guard<std::mutex> lock(mutex_);
            if (!ptr_) {                // 第二次检查（加锁）
                ptr_ = new Singleton();
            }
        }
        return ptr_;
    }
    // 同样删除拷贝构造与赋值
    Singleton(const Singleton&) = delete;
    Singleton& operator=(const Singleton&) = delete;

private:
    Singleton() = default;
    ~Singleton() = default;

    static std::atomic<Singleton*> ptr_;
    static std::mutex mutex_;
};

std::atomic<Singleton*> Singleton::ptr_{nullptr};
std::mutex Singleton::mutex_;

原理

首先无锁检查实例是否已存在，若不存在则获取互斥锁，再检查一次后创建实例。
通过 std::atomic 保证多线程可见性。

优点

在 C++03 或不支持 C++11 的环境中可用。
只在实例首次创建时加锁，后续调用不受锁影响。

缺点

代码相对复杂，容易出错（例如忘记 atomic 或锁）。
对构造函数异常的处理不够优雅，可能导致 ptr_ 未被正确释放。

3. 静态类成员初始化（早期初始化）

class Singleton {
public:
    static Singleton& instance() {
        return *ptr_;
    }

private:
    Singleton() = default;
    ~Singleton() = default;

    static Singleton* ptr_;
};

Singleton* Singleton::ptr_ = new Singleton();

原理

通过在类外部静态成员指针初始化，保证在程序启动时创建实例。

优点

实现简单，编译器负责初始化顺序。

缺点

实例在程序启动时即创建，不能实现懒加载。
在多模块编译时可能出现“初始化顺序问题”，导致跨模块访问时 ptr_ 未初始化。

4. 用 `std::call_once` 与 `std::once_flag`

class Singleton {
public:
    static Singleton& instance() {
        std::call_once(flag_, [](){ ptr_ = new Singleton(); });
        return *ptr_;
    }

    Singleton(const Singleton&) = delete;
    Singleton& operator=(const Singleton&) = delete;

private:
    Singleton() = default;
    ~Singleton() = default;

    static Singleton* ptr_;
    static std::once_flag flag_;
};

Singleton* Singleton::ptr_ = nullptr;
std::once_flag Singleton::flag_;

原理

std::call_once 确保给定 lambda 只被调用一次，即使有多个线程同时请求。
std::once_flag 用于记录调用状态。

优点

兼容 C++11，支持懒加载。
线程安全且实现简单，避免了手动锁。

缺点

同样需要手动管理 ptr_ 的生命周期（如在 atexit 时删除），否则可能导致资源泄漏。

5. 现代 C++ 推荐：Meyers 单例

综上所述，在支持 C++11 及以后标准的项目中，Meyers 单例 是最推荐的实现方式，因为：

简洁：仅一行 static 变量。
安全：编译器保证线程安全。
延迟加载：首次访问时才实例化。
可维护：不需要显式锁，代码更易读。

如果你需要在 C++03 环境下实现，或者对单例销毁时的顺序有特殊要求，可以考虑 std::call_once 或双重检查锁方案。

6. 小结

方法	适用标准	延迟加载	线程安全实现方式
Meyers 单例	C++11+	✔	编译器保证
双重检查锁	C++11+	✔	互斥锁 + 原子
静态成员初始化	任何	✘	程序启动时
std::call_once	C++11+	✔	once_flag

在实际项目中，请根据编译环境、性能需求以及资源管理需求选择最合适的实现方式。祝编码愉快！

在C++17标准中，STL算法首次提供了并行化的接口，允许程序员在不改动算法本身的情况下，利用多核CPU提升性能。并行算法通过 #include <execution> 提供了三种执行策略：std::execution::seq（顺序）、std::execution::par（并行）以及 std::execution::par_unseq（并行+向量化）。下面从原理、使用方式、性能评估以及常见陷阱四个维度，系统阐述如何在实际项目中合理使用这些算法。

1. 并行算法的工作原理

1.1 任务分解与负载均衡

par 策略会将传入的容器范围切分成若干子区间，通常与硬件线程数相对应。每个子区间由独立线程并行处理，完成后再将结果合并。STL 内部实现基于 std::thread 或线程池，并且会根据任务的大小自动决定是否切分，以避免过多的线程切换导致的开销。

1.2 向量化与分块

par_unseq 允许编译器对子区间内部进行向量化（SIMD），从而进一步加速数值密集型操作。向量化需要编译器支持（如 GCC 的 -ftree-vectorize）并且算法必须是无副作用、可并行化的。编译器会先尝试向量化，然后再按需并行化。

1.3 线程安全与内存模型

标准保证并行算法遵循 C++ 内存模型的“数据竞争无效性”，即只要满足“数据竞争自由”（std::atomic、std::mutex、或避免同一内存被多个线程写）即可。STL 在内部使用 std::lock_guard 或 std::atomic 对需要同步的共享资源进行保护。

2. 使用实例

2.1 并行排序

#include <vector>
#include <algorithm>
#include <execution>

int main() {
    std::vector <int> data(1'000'000);
    std::generate(data.begin(), data.end(),
                  [](){ return rand() % 1000000; });

    std::sort(std::execution::par, data.begin(), data.end());
}

std::sort 在 par 策略下会使用归并排序的变体，充分利用多核 CPU。

2.2 并行查找

auto it = std::find(std::execution::par, data.begin(), data.end(), target);
if (it != data.end()) { /* found */ }

如果 target 存在，算法会返回第一个匹配元素的迭代器；否则返回 end()。

2.3 并行变换与累加

std::vector <int> src(100'000);
std::vector <int> dst(100'000);
std::transform(std::execution::par,
               src.begin(), src.end(),
               dst.begin(),
               [](int x){ return x * 2 + 1; });

int sum = std::reduce(std::execution::par, dst.begin(), dst.end());

std::transform 与 std::reduce 都支持并行化，后者在 C++17 中是专门为并行设计的。

3. 性能评估与调优

场景	并行化收益	潜在瓶颈
大规模排序	高	内存带宽
简单查找	低	线程启动成本
数据转换	高	缓存不友好
累加	高	数据竞争（非原子）

3.1 何时使用 `par_unseq`

数值密集型（如矩阵乘法、FFT）
循环体 非副作用、可向量化
编译器支持并开启 -ftree-vectorize

3.2 线程数与硬件

STL 并行算法会自动获取 std::thread::hardware_concurrency()，但在多核与多租户系统上，最好手动控制线程数或使用线程池。例如，使用 std::async 与 std::launch::async 包装算法可进一步控制并发级别。

3.3 内存带宽与缓存局部性

并行化时，容器的物理布局会影响缓存命中率。使用 std::vector 连续存储优于 std::list。此外，避免在并行算法中频繁访问远离的内存地址（如在多线程中写入共享 std::vector 的不同区间）。

4. 常见陷阱与最佳实践

陷阱	解决方案
线程安全错误	确认算法内部无副作用；如需要写共享数据，使用 `std::mutex` 或 `std::atomic`。
过度并行化	对于小范围容器（< 1000）使用顺序算法；可通过自定义阈值切换。
编译器未向量化	检查 `-O3 -ftree-vectorize` 开关；确保循环无依赖。
不一致的随机数	并行算法内部不会产生随机数，若使用 `std::generate`，确保随机数生成器是线程安全或为每线程分配独立实例。
内存泄漏	并行算法不会影响内存管理；但若使用 `std::shared_ptr` 在并行区间内可能导致竞争，需谨慎。

最佳实践

先做基准：使用 std::chrono 或专用基准库测量 seq 与 par 的差异。
分阶段优化：先改为 par，再评估 par_unseq。
保持可读性：并行算法应写得与顺序版一样易读，避免过度宏化。
文档注释：标注并行策略，方便团队成员维护。

5. 未来展望

C++20 引入了并行算法的扩展，例如对 std::pmr（可定制内存资源）的支持，使得在并行环境下可以更灵活地控制内存分配。进一步的研究正在探索更细粒度的异步并行，如 std::future 与 std::async 的结合，以实现真正的任务流水线。随着编译器对向量化支持的提升，par_unseq 的性能差距将进一步拉大，为数值计算领域提供更强的工具。

小结

C++17 的并行算法为开发者提供了一个“声明式”并行化的途径，既减少了多线程编程的复杂度，又能显著提升性能。合理选择执行策略、关注线程安全与内存带宽，并通过基准测试验证收益，是把握并行算法最大价值的关键。通过本文的示例与经验分享，读者可以快速上手并在自己的项目中实现高效、可维护的并行代码。

C++中如何实现线程安全的单例模式

2026-01-14 作者 stdcpp

在多线程环境下实现一个单例对象时，最常见的难点是保证对象只被创建一次且在所有线程之间安全可见。下面以C++17为例，演示几种常用且线程安全的实现方式，并对其优缺点进行简要讨论。

1. 本地静态变量（Meyers单例）

class Singleton {
public:
    static Singleton& instance() {
        static Singleton inst;   // C++11 起线程安全
        return inst;
    }

    // 其他公共接口
    void do_something() { /* ... */ }

private:
    Singleton()  = default;            // 私有构造
    ~Singleton() = default;            // 私有析构
    Singleton(const Singleton&) = delete;
    Singleton& operator=(const Singleton&) = delete;
};

原理

在 C++11 之后，编译器保证对局部静态对象的初始化是线程安全的。首次访问 instance() 时，inst 以原子方式完成构造，随后所有线程都能安全访问同一实例。

优点

代码简洁，几乎不需要额外的同步机制。
延迟初始化，直到真正需要实例时才构造。

缺点

无法控制实例的销毁时机（在程序退出时自动销毁）。
对于需要按需销毁或重置的单例场景不够灵活。

2. `std::call_once` 与 `std::unique_ptr`

#include <memory>
#include <mutex>

class Singleton {
public:
    static Singleton& instance() {
        std::call_once(initFlag, []{
            instancePtr.reset(new Singleton());
        });
        return *instancePtr;
    }

    void do_something() { /* ... */ }

private:
    Singleton()  = default;
    ~Singleton() = default;
    Singleton(const Singleton&) = delete;
    Singleton& operator=(const Singleton&) = delete;

    static std::unique_ptr <Singleton> instancePtr;
    static std::once_flag initFlag;
};

std::unique_ptr <Singleton> Singleton::instancePtr;
std::once_flag Singleton::initFlag;

原理

std::call_once 只会让第一次调用时执行给定的 lambda，其余线程会等待直到初始化完成。std::unique_ptr 管理实例生命周期。

优点

可在需要时显式销毁单例（如 instancePtr.reset()），满足某些应用需求。
与 std::call_once 的语义更清晰，易于理解。

缺点

代码略显冗长，需手动维护静态成员。

3. 原子指针 + 双重检查锁（DCL）

#include <atomic>
#include <mutex>

class Singleton {
public:
    static Singleton* instance() {
        Singleton* tmp = instancePtr.load(std::memory_order_acquire);
        if (!tmp) {
            std::lock_guard<std::mutex> lock(mtx);
            tmp = instancePtr.load(std::memory_order_relaxed);
            if (!tmp) {
                tmp = new Singleton();
                instancePtr.store(tmp, std::memory_order_release);
            }
        }
        return tmp;
    }

    void do_something() { /* ... */ }

private:
    Singleton()  = default;
    ~Singleton() = default;
    Singleton(const Singleton&) = delete;
    Singleton& operator=(const Singleton&) = delete;

    static std::atomic<Singleton*> instancePtr;
    static std::mutex mtx;
};

std::atomic<Singleton*> Singleton::instancePtr{nullptr};
std::mutex Singleton::mtx;

原理

第一次检测到 instancePtr 为 nullptr 后，线程会尝试获取互斥锁并再次检查，确保只有一个线程执行实例化。std::memory_order_acquire/release 保证可见性。

优点

适用于需要在不同平台上手动控制同步细节的老旧代码。
可在 C++11 之前使用（只需自行实现原子与锁）。

缺点

代码更易出错，必须正确使用内存序。
过度同步会导致性能瓶颈，尤其在实例已创建后每次访问仍需检查 instancePtr。

4. 对比与选择

方法	线程安全性	是否延迟初始化	销毁控制	代码复杂度
本地静态变量	✅	✅	自动	低
`call_once`/`unique_ptr`	✅	✅	手动	中
双重检查锁	✅	✅	手动	高
传统单例（无同步）	❌	❌	难	低

最推荐：若项目已使用 C++11 或更高版本，首选 本地静态变量。其实现最简洁，且线程安全保证由标准提供。
需要销毁控制：使用 call_once + unique_ptr 或 std::shared_ptr（若需要共享所有权）来显式管理单例生命周期。
老项目或特殊需求：若项目对同步细节有特殊需求（如需要自定义内存序），可考虑 双重检查锁。

5. 小结

在多线程环境下实现单例模式时，关键是保证“只创建一次”和“所有线程可见”。自 C++11 起，标准库提供了足够成熟的工具（std::call_once、局部静态变量）来实现这一点，开发者不必再手动写复杂的锁代码。只有在极少数情况下（如需要自定义销毁时机、支持共享所有权或兼容旧编译器）才需要使用更复杂的方案。选择合适的实现方式，既能保证线程安全，又能保持代码简洁与易维护。

C++20中如何使用std::span实现安全的数组遍历？

2026-01-14 作者 stdcpp

在C++20中，std::span被引入为轻量级、无所有权的视图，用来表示一段连续存储的元素。相比传统的指针+长度或数组指针，std::span提供了更安全、易用的接口，并可与标准库算法无缝结合。下面从概念、使用场景、性能以及代码示例几个角度，详细介绍如何使用std::span实现安全的数组遍历。

1. std::span 简介

template<class ElementType, std::size_t Extent = std::dynamic_extent>
class span;

ElementType：元素类型。
Extent：大小，可为动态（默认）或静态。

std::span内部只保存指向首元素的指针和长度（若动态），不持有内存，适合作为函数参数、返回值或临时视图。

2. 为什么要用 std::span？

传统方法	缺点	std::span
`int* arr, std::size_t n`	参数错误可能导致越界；无法直接与算法配合；需要手动检查长度。	`std::span
`	自动保存长度；可与算法直接使用；防止越界。
`std::vector
& v`\| 需要复制或移动；对只读数据不够灵活。 \|`std::span`	只读视图；无需拷贝。
`T* begin, T* end`	参数对不一致时容易出错；需要自行计算长度。	`std::span
`	自动计算；支持范围 for。

3. 安全遍历的实现

3.1 传参方式

void printAll(std::span<const int> data) {
    for (int x : data)
        std::cout << x << ' ';
}

只读视图，任何尝试修改都会在编译期报错。
printAll({arr, 10}); 或 printAll(vector) 皆可。

3.2 边界检查

std::span 在标准库算法中会被视为容器，使用迭代器时会自动进行边界检查（如 std::for_each、std::sort）。如果你手动使用索引，仍需自行检查，或者使用 std::array 或 std::vector 等安全容器。

3.3 子视图

auto sub = data.subspan(2, 5); // 从第3个开始，取5个元素

如果超出范围，调用会触发 std::out_of_range。

4. 与标准算法结合

#include <algorithm>
#include <numeric>
#include <iostream>
#include <span>

int main() {
    int arr[] = {1,2,3,4,5,6,7,8,9,10};
    std::span <int> s(arr);          // 自动推导大小
    std::sort(s.begin(), s.end(), std::greater<>()); // 就地排序
    int sum = std::accumulate(s.begin(), s.end(), 0);
    std::cout << "Sum: " << sum << '\n';
}

std::sort 直接接受 span 的迭代器，内部不会做越界检查，但传入的范围已确定。
对于不可变数据，使用 std::span<const int>，可安全传递给只读算法。

5. 性能对比

方法	复制成本	运行时检查	典型使用
`int* + size`	0	需要手动检查	旧代码、性能极限
`std::vector
`	需要复制/移动	自动	大多数业务
`std::span
`	0	只在创建子视图时检查	函数接口、临时视图

std::span 与原始指针相比仅多了一份长度信息，几乎不增加运行时成本；其优势在于类型安全和易用性。

6. 常见误区

误认为 std::span 会拷贝数据
- 它只是视图，未拥有内存。
把 std::span 用作持久化成员
- 若引用的底层容器被销毁，span 将悬空。
使用 subspan 时不检查越界
- subspan 会在超出范围时抛异常，需捕获或避免。

7. 进阶应用

与C风格接口交互

void c_func(const int* data, std::size_t n);
c_func(span <int>{arr}.data(), span<int>{arr}.size());

将 span 作为返回值
返回子视图而不是拷贝整个容器。

8. 小结

std::span 通过提供一种轻量、安全的视图，极大提升了 C++20 代码的可读性与可维护性。它在函数参数、临时遍历、子视图以及与标准算法的结合上都表现出色。掌握 span 的正确使用方式，是现代 C++ 编程的重要技能。

实践建议：

在需要只读访问时使用 std::span<const T>。
在接口设计时优先使用 std::span 替代指针+长度。
对动态数组，尽量使用 std::vector 或 std::array；对临时遍历，使用 std::span。

通过上述方法，你可以在不牺牲性能的前提下，写出更安全、更易维护的 C++20 代码。

在C++中实现线程安全的单例模式：使用C++11的Meyers Singleton与双重检查锁定对比

2026-01-14 作者 stdcpp

在现代C++中，单例模式经常被用来控制全局资源的访问，例如日志系统、数据库连接池或全局配置管理。实现一个既安全又高效的单例在多线程环境中尤为关键。下面我们将比较两种常见实现：C++11 标准的 Meyers Singleton（局部静态变量）和传统 双重检查锁定（Double-Checked Locking, DCL）。

1. Meyers Singleton（局部静态变量）

C++11 引入了对局部静态变量的线程安全初始化保证。只要保证对象的构造过程不抛异常，使用局部静态变量的单例是天然线程安全且延迟初始化的。

class Logger {
public:
    static Logger& instance() {
        static Logger logger; // C++11 保证线程安全
        return logger;
    }

    void log(const std::string& msg) {
        std::lock_guard<std::mutex> lock(mutex_);
        std::cout << msg << std::endl;
    }

private:
    Logger() = default;
    ~Logger() = default;
    Logger(const Logger&) = delete;
    Logger& operator=(const Logger&) = delete;

    std::mutex mutex_;
};

优点

简洁：只需一行代码即可完成线程安全的单例。
延迟初始化：对象在第一次调用 instance() 时才被创建。
异常安全：若构造函数抛异常，后续调用会再次尝试初始化。

缺点

不可定制销毁顺序：如果需要在程序退出前按特定顺序销毁单例，局部静态变量的销毁顺序不可控。
无法延迟销毁：除非使用 std::unique_ptr 包装，单例会在程序结束时自动销毁。

2. 双重检查锁定（DCL）

DCL 通过在多线程访问时只在首次创建时加锁，随后通过检查实例是否为空来避免多余锁的开销。传统实现如下：

class Config {
public:
    static Config* instance() {
        if (instance_ == nullptr) {                 // 第一层检查
            std::lock_guard<std::mutex> lock(mutex_);
            if (instance_ == nullptr) {             // 第二层检查
                instance_ = new Config();
            }
        }
        return instance_;
    }

    void set(const std::string& key, const std::string& value) {
        std::lock_guard<std::mutex> lock(mapMutex_);
        configMap_[key] = value;
    }

    std::string get(const std::string& key) const {
        std::lock_guard<std::mutex> lock(mapMutex_);
        auto it = configMap_.find(key);
        return (it != configMap_.end()) ? it->second : "";
    }

private:
    Config() = default;
    ~Config() = default;
    Config(const Config&) = delete;
    Config& operator=(const Config&) = delete;

    static Config* instance_;
    static std::mutex mutex_;
    mutable std::mutex mapMutex_;
    std::unordered_map<std::string, std::string> configMap_;
};

Config* Config::instance_ = nullptr;
std::mutex Config::mutex_;

优点

可定制销毁：可以在程序任意位置显式调用 delete instance_，控制销毁顺序。
适用于C++03：在 C++11 之前，这是常用的线程安全单例实现。

缺点

复杂度高：需要手动维护锁、指针、检查。
易出错：如果忘记使用 volatile（C++11 之前）或未遵循内存模型，可能导致“读到未初始化的实例”。
性能略逊：即使在已初始化后，第一次访问仍需一次 nullptr 检查。

3. 何时使用哪种实现？

场景	推荐实现	说明
需要 C++11 或更高版本	Meyers Singleton	简洁、安全、无锁开销。
需要在 C++03 环境下实现	DCL	兼容旧编译器，需注意线程安全细节。
需要可定制销毁顺序	DCL	或者在 Meyers Singleton 中使用 `std::unique_ptr` 结合 `std::atexit` 手动销毁。
需要在静态初始化阶段访问	Meyers Singleton	对静态构造顺序敏感时不建议使用。

4. 进一步提升性能的技巧

使用 std::atomic：在 DCL 中将实例指针声明为 std::atomic<Config*>，避免因指针复用导致的悬挂指针。
懒加载与懒销毁：结合 std::unique_ptr 与 std::call_once，在首次访问时创建，在程序退出前手动销毁。
线程本地存储（TLS）：如果单例中的数据与线程无关，避免对共享资源加锁，改用 thread_local 变量实现线程局部单例。

5. 小结

C++11 及以后：首选 Meyers Singleton，代码最简洁，安全性得到语言标准保证。
C++03 或需要自定义销毁：双重检查锁定是可行的，但要非常小心实现细节，避免并发错误。
总体思路：始终先考虑线程安全和性能，再做实现细节的权衡。

通过本文的对比与示例，相信你可以在实际项目中选择合适的单例实现方案，既满足线程安全需求，又保持代码可维护性。

掌握C++17中的std::variant：实现类型安全的多态容器

2026-01-14 作者 stdcpp

在C++17标准中，std::variant 成为标准库的一部分，为实现类型安全的多态容器提供了极大便利。它可以在编译期保证只有预先声明的类型可以被存储，并且可以在运行时安全地访问其持有的具体类型。本文将从基本使用、访问方式、异常安全、递归类型以及结合 std::visit 的高级模式等方面，全面探讨 std::variant 的设计原理和实战技巧。

一、为什么需要 std::variant？

在传统 C++ 编程中，处理不同类型的值常用的做法有两种：

继承与虚函数：创建一个基类，所有具体类型派生自该基类，并在基类中声明虚函数。缺点是需要显式继承关系、对多态类的构造与销毁管理繁琐，并且不适合轻量级 POD 类型。
union + tag：手工维护一个标识字段，决定当前存储的类型。缺点是缺乏类型安全，且在包含非平凡类型时需要手动调用构造/析构。

std::variant 在此两者之间提供了平衡：它是一个 类型安全 的联合体，在编译期就检查类型合法性，并在运行时自动管理对象的生命周期，消除了手工管理的风险。

二、基本语法

#include <variant>
#include <iostream>

int main() {
    std::variant<int, std::string> v = 10;          // 直接存 int
    std::variant<int, std::string> w = "hello";     // 直接存 std::string

    std::cout << std::get<int>(v) << '\n';           // 取 int
    std::cout << std::get<std::string>(w) << '\n';   // 取 std::string
}

2.1 构造与赋值

列表初始化：std::variant<int, double> v{42}; 只能匹配唯一匹配的类型，否则编译错误。
默认构造：std::variant<int, std::string> v; 默认值是第一个类型的默认构造（int{}）。
赋值：v = 3.14; 自动构造 double 并成为当前持有的类型。

2.2 访问方式

访问方式	说明
`std::get
(v)`\| 如果`v`当前持有类型`T`，返回对应引用；否则抛`std::bad_variant_access`
`std::get_if
(&v)`\| 如果`v`当前持有类型`T`，返回指针，否则`nullptr`
`std::visit(visitor, v)`	调用 visitor 的 `operator()` 对当前类型进行处理

三、异常安全与赋值

std::variant 在赋值或构造时需要确保异常安全。实现时，先尝试构造新值到临时存储，然后原子交换指针。若构造失败，旧值保持不变。示例：

std::variant<int, std::string> v = 0;
try {
    v = std::string("long long string that may throw");
} catch (...) {
    // v 仍为 0
}

四、递归类型（变体中的变体）

std::variant 需要在编译时确定所有可能的类型。若需要递归定义，例如树节点：

struct Node; // 前向声明

using NodeVariant = std::variant<int, Node>;

struct Node {
    NodeVariant left;
    NodeVariant right;
};

但注意，递归的 std::variant 需要使用 std::in_place_index 或 std::in_place_type 进行构造，避免无限递归编译。示例：

Node root{NodeVariant{5}, NodeVariant{Node{NodeVariant{1}, NodeVariant{}}}};

五、高级用法：结合 std::visit

5.1 基本访问

std::variant<int, std::string, double> v = 3.14;

std::visit([](auto&& arg) {
    std::cout << "value: " << arg << '\n';
}, v);

auto&& arg 使得访问在编译时对不同类型做相同处理。若想在不同类型做不同逻辑：

std::visit(overloaded {
    [](int i) { std::cout << "int: " << i << '\n'; },
    [](const std::string& s) { std::cout << "string: " << s << '\n'; },
    [](double d) { std::cout << "double: " << d << '\n'; }
}, v);

需要 overloaded 辅助模板（可自己实现或使用 C++17 的 std::variant 版本）：

template<class... Ts> struct overloaded : Ts... { using Ts::operator()...; };
template<class... Ts> overloaded(Ts...) -> overloaded<Ts...>;

5.2 访问链式递归

当 std::variant 嵌套层级较深时，可以使用 std::apply 或递归模板来展开。示例：计算嵌套 std::variant 的所有整数和。

int sum(const std::variant<int, std::string, std::variant<int, std::string>>& v) {
    return std::visit(overloaded{
        [](int i) { return i; },
        [](const std::string&) { return 0; },
        [](const auto& inner) { return sum(inner); } // 递归
    }, v);
}

六、性能考虑

大小与对齐：std::variant 的大小等于其最大成员的大小加上一个字节的 index（存储当前类型索引）。若成员差异较大，可考虑 std::aligned_union 以优化。
移动构造：std::variant 的移动构造在内部实现是对其 index 的拷贝，随后根据 index 调用对应类型的移动构造。若成员耗时，尽量使用 std::in_place_type 明确指定构造方式，减少临时拷贝。
缓存优化：如果访问频繁且需要做类型检查，std::visit 的多态调用会导致分支预测失效。可在访问前使用 std::get_if 检查 index 再调用 visit，或者使用 std::visit 的 overloaded 结合 switch 语句手动拆分。

七、实战案例：多态日志记录器

假设我们需要一个日志系统，既可以输出文本日志，也可以输出 JSON 对象或二进制帧。使用 std::variant 可以做到：

#include <variant>
#include <string>
#include <iostream>
#include <nlohmann/json.hpp> // 假设使用第三方 JSON 库

struct BinaryFrame {
    std::vector <uint8_t> data;
};

using LogEntry = std::variant<std::string, nlohmann::json, BinaryFrame>;

void log(const LogEntry& entry) {
    std::visit(overloaded{
        [](const std::string& s) { std::cout << "[TEXT] " << s << '\n'; },
        [](const nlohmann::json& j) { std::cout << "[JSON] " << j.dump() << '\n'; },
        [](const BinaryFrame& f) {
            std::cout << "[BINARY] size=" << f.data.size() << '\n';
        }
    }, entry);
}

调用：

log(std::string("Hello World"));
log(nlohmann::json{{"user","alice"},{"action","login"}});
log(BinaryFrame{{0x01,0x02,0x03}});

八、总结

std::variant 让多态容器变得类型安全且易于使用，避免手工维护标识字段。
通过 std::visit 可以轻松实现对多种类型的统一处理，结合 overloaded 模式实现不同类型的分支逻辑。
对递归或嵌套类型需使用 in_place_type 或 in_place_index 以避免无限递归编译。
性能方面，std::variant 的内存占用固定，访问时需要考虑分支预测和缓存行为。

掌握这些技巧后，你就能在 C++17 代码中自然地使用 std::variant，既保持类型安全，又获得更高的代码可读性与可维护性。

C++17中的折叠表达式及其在数学库中的应用

2026-01-14 作者 stdcpp

折叠表达式是 C++17 引入的一项强大特性，它让对可变参数模板参数包（parameter pack）进行递归操作变得既简洁又高效。本文将从语法角度出发，结合实战场景，展示如何在自定义数学库中利用折叠表达式实现求和、求积、最小/最大值等功能，并讨论其与传统递归实现的对比与性能影响。

1. 折叠表达式的基本语法

折叠表达式通过把操作符“折叠”到参数包上，自动展开为左折叠、右折叠或全折叠。其基本形式如下：

折叠类型	语法	展开示例
左折叠	`(... op args)`	`((a op b) op c) op d …`
右折叠	`(args op ...)`	`a op (b op (c op d …))`
全折叠	`(... op args ...)`	`((a op b) op (c op d)) …`

其中 op 可以是任何二元运算符（+, *, &&, ||, <<, >>, , 等），还可以是用户自定义的函数对象。

注意：折叠表达式要求参数包不为空，否则编译器会报错。若需要支持空包，可配合三目运算符或 std::integral_constant 进行特殊处理。

2. 求和与求积的实现

2.1 基础实现

#include <iostream>
#include <numeric>
#include <initializer_list>

template<typename T, typename... Args>
constexpr T sum(T init, Args... args) {
    return (init + ... + args);   // 左折叠
}

template<typename T, typename... Args>
constexpr T product(T init, Args... args) {
    return (init * ... * args);   // 左折叠
}

示例使用：

int main() {
    std::cout << sum(0, 1, 2, 3, 4) << '\n';       // 10
    std::cout << product(1, 2, 3, 4, 5) << '\n';   // 120
}

2.2 支持空参数包

如果想让 sum() 能处理仅有初始值而无其他参数的情况，可使用三目运算符：

template<typename T, typename... Args>
constexpr T sum(T init, Args... args) {
    return (sizeof...(args) == 0) ? init : (init + ... + args);
}

3. 求最小值 / 最大值

3.1 通过比较器实现

折叠表达式同样能处理 std::min / std::max 的变体。使用 std::min 的三元比较：

template<typename T, typename... Args>
constexpr T min_value(T first, Args... args) {
    return (args < ... < first) ? first : ((first < ... < args) ? first : args);
}

但这写法有点繁琐。更简洁的方法是使用 std::min 的二元版本进行折叠：

template<typename T, typename... Args>
constexpr T min_value(T first, Args... args) {
    return (first < ... < args);
}

同理：

template<typename T, typename... Args>
constexpr T max_value(T first, Args... args) {
    return (first > ... > args);
}

3.2 结合用户自定义比较器

template<typename T, typename Comp, typename... Args>
constexpr T min_value(Comp comp, T first, Args... args) {
    return (comp(first, args) ? first : args);
}

但这里需要注意比较器应返回布尔值。

4. 与传统递归实现对比

4.1 递归实现示例

template<typename T>
constexpr T sum(T val) { return val; }

template<typename T, typename... Args>
constexpr T sum(T first, Args... rest) {
    return first + sum(rest...);
}

4.2 性能与可读性

方案	关键字	可读性	编译时间	运行时性能
递归	`template recursion`	较低	可能稍慢	取决于展开深度
折叠	`(... op ...)`	高	通常更快	与递归相当，或更快（编译器可进一步优化）

折叠表达式消除了显式递归层次，使代码更简洁，同时编译器可一次性展开为单一表达式，常常得到更优化的机器码。

5. 在数学库中的实战案例

假设我们正在开发一个轻量级数学库 SimpleMath，需要提供以下功能：

向量加法
向量内积
任意数量的标量乘法

5.1 向量加法（使用折叠表达式）

#include <array>
#include <stdexcept>

template<std::size_t N, typename T>
struct Vector {
    std::array<T, N> data;

    // 构造函数
    constexpr Vector(const std::array<T, N>& arr) : data(arr) {}

    // 加法
    template<typename... Vectors>
    constexpr Vector operator+(const Vector& other, const Vectors&... rest) const {
        if constexpr (sizeof...(rest) == 0) {
            Vector res{data};
            for (std::size_t i = 0; i < N; ++i)
                res.data[i] += other.data[i];
            return res;
        } else {
            auto temp = *this + other;
            return temp + rest...;
        }
    }
};

虽然这里仍使用递归，但可以进一步利用折叠表达式对 data[i] 的求和：

constexpr T sum_elements() const {
    return (data[0] + ... + data[N-1]);  // 折叠求和
}

5.2 内积

template<std::size_t N, typename T>
constexpr T dot(const Vector<N, T>& a, const Vector<N, T>& b) {
    T result = 0;
    for (std::size_t i = 0; i < N; ++i)
        result += a.data[i] * b.data[i];
    return result;
}

如果想支持变长乘积，也可使用折叠表达式：

template<typename T, typename... Vectors>
constexpr T dot_product(const Vectors&... vecs) {
    if constexpr (sizeof...(vecs) == 1) {
        return (vecs.data[0] * ... * vecs.data[N-1]); // 仅当所有向量长度相同
    } else {
        // 递归展开
        return dot_product(vecs[0], vecs[1], ...) * dot_product(...);
    }
}

5.3 任意数量的标量乘法

template<typename T, typename... Scalars>
constexpr T scalar_multiply(T init, Scalars... scalars) {
    return (init * ... * scalars);   // 折叠乘法
}

使用示例：

int main() {
    int x = scalar_multiply(2, 3, 4, 5); // 120
}

6. 常见陷阱与最佳实践

陷阱	解决方案
参数包为空导致编译错误	使用 `sizeof...(args) == 0` 检查，或提供默认实现
只支持内置运算符	若需自定义操作，使用 `std::invoke` 或函数对象包装
递归深度过大导致编译时间膨胀	对于非常大的参数包，考虑使用 `std::initializer_list` 或迭代实现
折叠表达式无法满足某些非二元运算	可以使用 `std::initializer_list` 与 `std::accumulate` 组合

7. 小结

折叠表达式是 C++17 对可变参数模板的极大提升，它将多重递归展开压缩为单行表达式，既提升了代码可读性，又能让编译器做更好优化。通过本文的示例，你可以轻松在自己的 C++ 项目中引入折叠表达式，无论是求和、求积、最小/最大值，还是更复杂的数学运算，都能得到简洁而高效的实现。祝编码愉快！

C++ 中的内存池：实现与优化

2026-01-14 作者 stdcpp

在高性能系统中，频繁的动态内存分配往往成为瓶颈。内存池（Memory Pool）是一种将大量小对象的分配与释放集中到一个区域的技术，可以显著降低系统调用开销，提高内存访问效率。本文将从概念、实现思路、典型使用场景以及性能优化四个角度，深入剖析 C++ 内存池的实用方法。

1. 何谓内存池？

内存池是一块预先申请的连续内存块，内部划分为若干等长或不等长的块。程序需要分配对象时，从内存池中取出一块；释放时，将该块标记为可复用。与标准 new/delete 或 malloc/free 相比，内存池避免了系统级的碎片化与多次系统调用。

2. 内存池的基本实现

下面给出一个最简化的内存池实现示例，使用单链表维护空闲块。

#include <cstddef>
#include <cstdlib>
#include <new>
#include <mutex>

template <std::size_t BlockSize, std::size_t BlockCount>
class SimplePool {
public:
    SimplePool() {
        // 预分配一个大块
        memory_ = static_cast<char*>(std::malloc(BlockSize * BlockCount));
        if (!memory_) throw std::bad_alloc();

        // 构造空闲链表
        for (std::size_t i = 0; i < BlockCount - 1; ++i) {
            void* current = memory_ + i * BlockSize;
            void* next = memory_ + (i + 1) * BlockSize;
            *reinterpret_cast<void**>(current) = next;
        }
        *reinterpret_cast<void**>(memory_ + (BlockCount - 1) * BlockSize) = nullptr;
        free_list_ = memory_;
    }

    ~SimplePool() {
        std::free(memory_);
    }

    void* allocate() {
        std::lock_guard<std::mutex> lock(mutex_);
        if (!free_list_) return nullptr; // 空闲块已耗尽
        void* ret = free_list_;
        free_list_ = *reinterpret_cast<void**>(free_list_);
        return ret;
    }

    void deallocate(void* ptr) {
        std::lock_guard<std::mutex> lock(mutex_);
        *reinterpret_cast<void**>(ptr) = free_list_;
        free_list_ = ptr;
    }

private:
    char* memory_;
    void* free_list_;
    std::mutex mutex_;
};

关键点说明

预分配：一次性申请足够的内存，避免多次 malloc/new。
空闲链表：利用内存块自身存放指向下一个空闲块的指针，节省额外结构。
线程安全：使用 std::mutex 简单保护并发操作；对于高并发场景，可采用无锁技术或分片池。

3. 典型使用场景

场景	说明
游戏开发	需要频繁创建/销毁游戏对象（如子弹、粒子）。
网络服务器	处理大量短生命周期请求，内存分配成为性能瓶颈。
嵌入式系统	内存资源受限，内存池可避免碎片化。
数据库缓存	需要快速读写相同大小的记录。

4. 性能优化技巧

对象对齐：确保 BlockSize 是对齐边界的整数倍，避免 CPU 访存异常。
内存预热：程序启动时就分配完整块，避免后期分配导致的页面错误。
多层池：根据对象大小划分多级池，减少不同大小对象共享同一池带来的碎片。
无锁实现：使用 std::atomic<void*> 与 compare‑exchange 操作，完全避免锁。
缓存友好：在内存池中按页布局，使空闲块集中在同一缓存行。

5. 与 STL 容器的整合

C++ 标准库容器（如 std::vector、std::list）默认使用 std::allocator。可以通过自定义 allocator 将内存池注入容器，实现更细粒度的内存管理：

template <typename T>
struct PoolAllocator {
    using value_type = T;
    PoolAllocator(SimplePool<sizeof(T), 1024>* pool) : pool_(pool) {}

    T* allocate(std::size_t n) {
        if (n != 1) throw std::bad_alloc(); // 简化示例，只支持单对象
        void* ptr = pool_->allocate();
        if (!ptr) throw std::bad_alloc();
        return new (ptr) T(); // 构造
    }

    void deallocate(T* p, std::size_t) {
        p->~T();          // 析构
        pool_->deallocate(p);
    }

private:
    SimplePool<sizeof(T), 1024>* pool_;
};

随后即可：

SimplePool<sizeof(int), 4096> intPool;
std::vector<int, PoolAllocator<int>> vec(PoolAllocator<int>(&intPool));

6. 结语

内存池是一种极具价值的性能优化工具，尤其适用于对象生命周期短、频繁创建/销毁的场景。通过正确的实现与细节优化，可以显著提升应用程序的吞吐量与响应速度。希望本文能为你在 C++ 项目中实现高效内存池提供参考与启示。

C++20 模块：提升编译速度与可维护性

2026-01-14 作者 stdcpp

C++20 引入了模块（Modules）机制，旨在解决传统头文件（Header Files）在大型项目中带来的编译慢、重复包含以及命名冲突等痛点。本文将从模块的基本概念、构建方式、使用技巧以及常见坑点等方面进行剖析，帮助读者快速掌握并实践模块化编程。

一、模块的基本概念

模块单元（Module Unit）
- export 声明的代码成为模块接口（Module Interface）。
- 其余未 export 的代码仅在内部使用。
模块视图（Module View）
- 其它翻译单元（Translation Unit）通过 import 引入模块视图，以获取其公开接口。
预编译模块（Precompiled Modules）
- 通过 -fprebuilt-module-path 生成的模块编译单元，可直接重用，避免重复编译。

二、模块的构建步骤

创建模块接口文件（math.mpp）

// math.mpp
export module math;      // 模块名
export namespace math {
    int add(int a, int b);
    double sqrt(double x);
}
export int math::add(int a, int b) { return a + b; }
export double math::sqrt(double x) { return std::sqrt(x); }

编译模块接口

g++ -std=c++20 -fmodules-ts -c math.mpp -o math.o

使用模块的源文件（main.cpp）

// main.cpp
import math;
#include <iostream>

int main() {
    std::cout << "3 + 4 = " << math::add(3,4) << '\n';
    std::cout << "sqrt(16) = " << math::sqrt(16.0) << '\n';
}

编译链接
```
g++ -std=c++20 main.cpp math.o -o demo
```

三、与传统头文件的对比

特性	头文件	模块
编译时间	需要重新解析每个文件	预编译一次即可
命名空间冲突	可能导致冲突	自动限定作用域
依赖管理	需手动 `#include`	自动解析依赖
可维护性	难以追踪依赖	依赖显式声明

四、使用模块的技巧

模块分层
- 将基础库（如 math、utils）打包成单独模块，业务层再 import。
避免循环依赖
- 模块不支持互相 import 循环，设计时保持单向依赖。
使用预编译模块
- 对于第三方库（如 Boost）可自行生成 .pcm 文件，显著提升编译速度。
与旧代码混合
- 旧项目可逐步将关键头文件迁移为模块，保持旧头文件兼容。

五、常见坑点与解决方案

编译器支持不足
- 目前主流编译器（GCC、Clang、MSVC）都已支持 C++20 模块，但某些特性仍处于实验阶段。
- 方案：使用 -fmodules-ts 或 -fexperimental-modules 开启实验支持。
路径问题
- import 语句只识别模块名，而不是路径。若模块位于非标准目录，需要通过 -fmodule-map-file 或 -fmodule-path 指定。
命名冲突
- 由于模块默认不暴露全局作用域，避免了传统 #include 产生的全局污染。
- 但若使用 export 了全局变量或函数，仍需注意。
旧工具链的集成
- 某些 IDE 或 CI 系统尚未完美支持模块。
- 方案：使用 CMake 的 target_precompile_headers 或手动配置编译命令。

六、实战案例：构建一个简易 JSON 库

// json.mpp
export module json;
export namespace json {
    struct Value;
    Value parse(const std::string &);
}
export struct json::Value {
    enum class Type { Null, Bool, Number, String, Array, Object };
    Type type;
    std::variant<std::monostate, bool, double, std::string,
                 std::vector <Value>, std::unordered_map<std::string, Value>> data;
};

通过将 json 库打包为模块，项目中仅需 import json;，而无需每个源文件都包含复杂的头文件。

七、结语

C++20 模块为现代 C++ 提供了更清晰、可维护且高效的编译模型。虽然目前仍在完善，但已足够满足大多数项目需求。建议从小模块入手，逐步迁移现有代码，最终实现全模块化体系，享受更快的编译速度与更稳健的代码结构。祝你在模块化旅程中愉快编码！

1. RAII 的基本概念

2. RAII 的实现要点

3. RAII 在多线程中的应用

3.1 互斥量

3.2 条件变量

3.3 原子计数器的 RAII 包装

4. RAII 的高级用例

4.1 资源池与 RAII

4.2 事务管理

5. 可能的陷阱与注意事项

6. 小结

1. 经典的 Meyers 单例（C++11 之后天然线程安全）

原理

优点

缺点

2. 双重检查锁（Double-Check Locking）

原理

优点

缺点

3. 静态类成员初始化（早期初始化）

原理

优点

缺点

4. 用 std::call_once 与 std::once_flag

原理

优点

缺点

5. 现代 C++ 推荐：Meyers 单例

6. 小结

1. 并行算法的工作原理

1.1 任务分解与负载均衡

1.2 向量化与分块

1.3 线程安全与内存模型

2. 使用实例

2.1 并行排序

2.2 并行查找

2.3 并行变换与累加

3. 性能评估与调优

3.1 何时使用 par_unseq

3.2 线程数与硬件

3.3 内存带宽与缓存局部性

4. 常见陷阱与最佳实践

5. 未来展望

小结

1. 本地静态变量（Meyers单例）

原理

优点

缺点

2. std::call_once 与 std::unique_ptr

原理

优点

缺点

3. 原子指针 + 双重检查锁（DCL）

原理

优点

缺点

4. 对比与选择

5. 小结

1. std::span 简介

2. 为什么要用 std::span？

3. 安全遍历的实现

3.1 传参方式

3.2 边界检查

3.3 子视图

4. 与标准算法结合

5. 性能对比

6. 常见误区

7. 进阶应用

8. 小结

1. Meyers Singleton（局部静态变量）

优点

缺点

2. 双重检查锁定（DCL）

优点

缺点

3. 何时使用哪种实现？

4. 进一步提升性能的技巧

5. 小结

一、为什么需要 std::variant？

二、基本语法

1. 经典的 `Meyers` 单例（C++11 之后天然线程安全）

4. 用 `std::call_once` 与 `std::once_flag`

3.1 何时使用 `par_unseq`

2. `std::call_once` 与 `std::unique_ptr`