standrad c++ – 第 79 页

如何在C++中实现一个线程安全的单例模式？

2026-01-22 作者 stdcpp

单例模式（Singleton Pattern）是一种常用的软件设计模式，旨在保证一个类只有一个实例，并提供一个全局访问点。实现单例模式时，需要考虑多线程环境下的线程安全性。下面以 C++17 标准为例，介绍几种常用且线程安全的实现方式。

1. 局部静态变量（Meyers Singleton）

class Singleton {
public:
    static Singleton& instance() {
        static Singleton instance;   // C++11 起线程安全的局部静态初始化
        return instance;
    }
    // 禁止拷贝构造和赋值
    Singleton(const Singleton&) = delete;
    Singleton& operator=(const Singleton&) = delete;

private:
    Singleton() = default;
    ~Singleton() = default;
};

优点

简单直观，代码量少。
由于 C++11 之后局部静态对象的初始化是线程安全的，能够避免多线程竞争。
延迟初始化（第一次调用时才创建实例），节省资源。

缺点

只能在函数内部创建，无法控制实例的销毁时机（在程序结束时由系统回收）。
对于需要显式销毁或多次重置的场景不太适用。

2. 带锁的单例（显式互斥锁）

class ThreadSafeSingleton {
public:
    static ThreadSafeSingleton* getInstance() {
        std::call_once(initFlag, []() {
            instance = new ThreadSafeSingleton();
        });
        return instance;
    }

private:
    ThreadSafeSingleton() = default;
    ~ThreadSafeSingleton() = default;
    ThreadSafeSingleton(const ThreadSafeSingleton&) = delete;
    ThreadSafeSingleton& operator=(const ThreadSafeSingleton&) = delete;

    static ThreadSafeSingleton* instance;
    static std::once_flag initFlag;
};

ThreadSafeSingleton* ThreadSafeSingleton::instance = nullptr;
std::once_flag ThreadSafeSingleton::initFlag;

优点

通过 std::call_once 与 std::once_flag 确保只执行一次初始化，且线程安全。
可用于需要自定义析构顺序的情况（例如在 atexit 里手动删除实例）。

缺点

代码稍长，维护成本略高。
仍然采用单例指针方式，可能导致悬挂指针或多次 delete 的风险。

3. `std::shared_ptr` 与 `std::weak_ptr` 结合

class LazySingleton {
public:
    static std::shared_ptr <LazySingleton> getInstance() {
        std::lock_guard<std::mutex> lock(mtx);
        if (auto sp = instance.lock()) {
            return sp;
        }
        auto sptr = std::shared_ptr <LazySingleton>(new LazySingleton());
        instance = sptr;
        return sptr;
    }

private:
    LazySingleton() = default;
    ~LazySingleton() = default;
    LazySingleton(const LazySingleton&) = delete;
    LazySingleton& operator=(const LazySingleton&) = delete;

    static std::weak_ptr <LazySingleton> instance;
    static std::mutex mtx;
};

std::weak_ptr <LazySingleton> LazySingleton::instance;
std::mutex LazySingleton::mtx;

优点

支持 std::shared_ptr 自动管理生命周期，避免手动删除。
weak_ptr 防止循环引用，实例在所有共享指针被销毁后自动释放。
可以在多线程环境下安全创建和销毁实例。

缺点

需要手动加锁，性能略低于局部静态变量实现。
代码更复杂，理解成本更高。

4. 使用 `std::atomic` 的双检查锁

class AtomicSingleton {
public:
    static AtomicSingleton* getInstance() {
        auto ptr = instance.load(std::memory_order_acquire);
        if (!ptr) {
            std::lock_guard<std::mutex> lock(mtx);
            ptr = instance.load(std::memory_order_relaxed);
            if (!ptr) {
                ptr = new AtomicSingleton();
                instance.store(ptr, std::memory_order_release);
            }
        }
        return ptr;
    }

private:
    AtomicSingleton() = default;
    ~AtomicSingleton() = default;
    AtomicSingleton(const AtomicSingleton&) = delete;
    AtomicSingleton& operator=(const AtomicSingleton&) = delete;

    static std::atomic<AtomicSingleton*> instance;
    static std::mutex mtx;
};

std::atomic<AtomicSingleton*> AtomicSingleton::instance{nullptr};
std::mutex AtomicSingleton::mtx;

优点

只在首次创建实例时加锁，后续访问无需加锁，性能更好。
适用于高频访问单例的场景。

缺点

实现复杂，易出现指针悬挂或内存泄漏。
需要严格遵循 std::memory_order 的规范，错误使用会导致难以调试的 bug。

5. 何时使用哪种实现？

需求	推荐实现
仅需在程序结束时创建并销毁，延迟初始化	局部静态变量（Meyers）
需要手动销毁、显式析构顺序	带锁 + `std::once_flag`
需要自动管理生命周期，支持多处共享	`shared_ptr` + `weak_ptr`
高性能，多次访问，避免每次加锁	双检查锁 + `std::atomic`

6. 小结

C++11 起，局部静态变量的初始化已实现线程安全，最简洁的单例实现是使用 Meyers 单例模式。
对于更复杂的生命周期管理，建议使用 std::once_flag 或 std::shared_ptr 与 std::weak_ptr 的组合。
双检查锁可以在高并发读多写少的场景中提升性能，但实现要格外谨慎。

在实际项目中，往往优先考虑简洁和可维护性。除非有明确的性能瓶颈或生命周期需求，否则建议使用局部静态变量实现。这样既能保证线程安全，又能避免额外的锁开销。

如何在C++中实现一个线程安全的单例模式？

2026-01-22 作者 stdcpp

在多线程环境下，单例模式需要保证只有一个实例，并且在多个线程并发访问时不产生竞态条件。C++11 引入了线程安全的静态局部变量初始化，利用这一特性可以轻松实现线程安全的单例。下面给出几种常见实现方式，并对它们的优缺点做简要比较。

1. Meyers单例（C++11 之后）

class Singleton {
public:
    static Singleton& instance() {
        static Singleton instance;   // 线程安全初始化
        return instance;
    }
    Singleton(const Singleton&) = delete;
    Singleton& operator=(const Singleton&) = delete;
private:
    Singleton() {}   // 私有构造
};

优点

代码最简洁，使用标准库即可。
编译器保证线程安全的初始化，性能优秀。
延迟加载：实例仅在第一次访问时创建。

缺点

不能在运行时销毁实例（如果需要在程序结束后释放资源，可在程序末尾手动调用 instance().~Singleton() 或使用 std::unique_ptr 包装）。
需要 C++11 或更高版本。

2. 带互斥锁的懒汉式（适用于 C++11 之前）

#include <mutex>

class Singleton {
public:
    static Singleton* getInstance() {
        if (!instance_) {
            std::lock_guard<std::mutex> lock(mutex_);
            if (!instance_) {
                instance_ = new Singleton();
            }
        }
        return instance_;
    }
    ~Singleton() { delete instance_; }
private:
    Singleton() {}
    Singleton(const Singleton&) = delete;
    Singleton& operator=(const Singleton&) = delete;
    static Singleton* instance_;
    static std::mutex mutex_;
};

Singleton* Singleton::instance_ = nullptr;
std::mutex Singleton::mutex_;

优点

兼容旧版本 C++（如 C++03）。
可以手动控制实例的销毁。

缺点

双重检查锁（Double-Checked Locking）在某些编译器/平台上仍可能存在可见性问题。
额外的锁开销，即使实例已创建后仍需检查。

3. 使用 `std::call_once`

#include <mutex>

class Singleton {
public:
    static Singleton& instance() {
        std::call_once(initFlag_, []() { instance_ = new Singleton(); });
        return *instance_;
    }
    ~Singleton() { delete instance_; }
private:
    Singleton() {}
    Singleton(const Singleton&) = delete;
    Singleton& operator=(const Singleton&) = delete;
    static Singleton* instance_;
    static std::once_flag initFlag_;
};

Singleton* Singleton::instance_ = nullptr;
std::once_flag Singleton::initFlag_;

优点

std::call_once 保证一次性初始化，线程安全且效率高。
与 std::mutex 的双重检查相比更简洁。

缺点

需要手动销毁实例；若不销毁，可能在 atexit 期间出现已销毁后仍被访问的问题。

4. 静态唯一实例（带手动销毁）

class Singleton {
public:
    static Singleton& instance() {
        static Singleton instance;
        return instance;
    }
    static void destroy() {
        // 必须先把引用计数降到0或手动销毁
    }
private:
    Singleton() {}
};

此方式适用于想在运行时销毁单例，但仍想保持线程安全。

总结

最推荐：如果使用 C++11 及以上，Meyers 单例是最简洁、性能最佳的选择。
兼容旧版：若项目需兼容 C++03，使用 std::mutex + 双重检查或 std::call_once（需手动实现）是可行方案。
需要手动销毁：使用 std::call_once 或 Meyers 并在程序退出前手动销毁实例。

在实际项目中，建议先评估编译器支持、性能需求和资源管理需求，然后选用最合适的实现方式。

C++ 之《智能指针的内部实现原理与最佳实践》

2026-01-22 作者 stdcpp

在 C++ 里，智能指针是管理动态内存的重要工具。它们通过 RAII 原则保证资源在使用后得到释放，从而降低泄漏风险。本文将重点剖析 std::shared_ptr 与 std::unique_ptr 的内部实现细节，并给出在实际项目中的最佳使用建议。

std::unique_ptr 的实现原理
- 单一所有权：unique_ptr 内部仅持有裸指针和（可选的）删除器。其构造函数通过移动语义获得资源，拷贝构造被删除，确保同一时间只有一个实例拥有该指针。
- 删除器：默认使用 `std::default_delete `，但可自定义。删除器本质上是一个可调用对象，通常在 `~unique_ptr()` 时被直接调用。
- 异常安全：由于 unique_ptr 只维护裸指针，销毁时只需一次 delete，异常不影响销毁过程。
- 实现技巧：标准库中大多数实现通过在 unique_ptr 内部直接存放指针，而删除器则作为一个完整的成员（如 std::function）。如果删除器是空（即默认的 lambda），可以利用“空删除器优化”让对象占用空间最小。
std::shared_ptr 的实现原理
- 引用计数：shared_ptr 使用一个共用的计数器（std::atomic ）来跟踪指向同一对象的所有实例数量。该计数器与对象分离存放，通常放在一个共同的控制块（control block）中。
- 控制块：包含计数器、删除器、原始指针以及可能的弱计数器（用于 std::weak_ptr）。控制块的分配一般使用 operator new 或专门的内存池，确保与对象一起分配以减少碎片。
- 原子操作：自增/自减计数器使用 fetch_add/fetch_sub，保证多线程环境下的安全。
- 懒加载删除器：在最后一个 shared_ptr 被销毁时，计数器递减到 0，随后调用删除器销毁对象，然后销毁控制块自身。
- 内存布局：大多数实现将控制块与对象一起在同一内存块中布局（如 std::allocate_shared 的实现），减少两次内存分配，提升缓存友好性。
共享计数器与异常安全
- 构造过程：`make_shared ` 先一次性分配一个大块内存，然后构造控制块和对象。若构造对象时抛出异常，控制块会立即销毁，避免泄漏。
- 拷贝与移动：拷贝构造只递增计数器，移动构造不改变计数。
- 线程安全：在多线程场景下，shared_ptr 的拷贝/销毁都需要原子操作；然而使用时需避免多线程竞争导致的使用后析构问题，推荐使用 std::atomic<std::shared_ptr> 或 std::shared_ptr 的内部原子计数。
最佳实践
- 首选 unique_ptr：当资源拥有者不需要共享时，使用 unique_ptr；它更轻量，性能更好。
- 共享时使用 make_shared：`std::make_shared ()` 能一次性分配控制块和对象，减少内存碎片。
- 自定义删除器：对特殊资源（如文件句柄、网络连接）使用自定义删除器，确保正确释放。
- 避免循环引用：shared_ptr 循环引用导致内存泄漏，常用 std::weak_ptr 破环循环。
- 线程安全：如果共享指针在多线程之间共享，考虑使用 std::atomic<std::shared_ptr> 或锁。
- 性能监测：在高性能项目中，记录 shared_ptr 的计数器操作次数，评估是否需要优化为 unique_ptr 或手动管理。
常见误区
- 错误的初始化：`shared_ptr p(new T)` 与 `auto p = std::make_shared()` 的区别。后者更安全、性能更好。
- 使用 delete：不要手动 delete 已被智能指针管理的指针；这会导致 double free。
- 强制转换：static_cast 或 reinterpret_cast 转换指针后不应再传给智能指针；使用 std::unique_ptr<T, Deleter> 或 std::shared_ptr<T> 的转换构造函数。
案例演示
```
#include <memory>
#include <iostream>
```

struct Widget { Widget() { std::cout << "Widget constructed\n"; } ~Widget() { std::cout << "Widget destroyed\n"; } };

int main() { auto p1 = std::make_shared

(); std::weak_ptr wp = p1; // 形成弱引用 { std::shared_ptr p2 = p1; // 引用计数 +1 std::cout

深入理解C++中的移动语义与右值引用

2026-01-22 作者 stdcpp

在 C++11 之后，移动语义和右值引用（rvalue references）成为提升程序性能的关键工具。它们允许我们在资源管理上实现“转移”而非“复制”，从而极大地减少不必要的内存拷贝，尤其在容器实现、工厂模式和接口设计中表现尤为突出。

1. 为什么需要移动语义？

传统的拷贝构造函数会深拷贝所有资源，既耗时又占用额外内存。对于大型对象（如图像处理缓冲区、网络数据包、数据库连接句柄），复制成本高得不止是性能瓶颈，甚至可能导致内存泄漏或资源竞争。移动语义允许我们将资源所有权从一个对象“搬移”到另一个对象，而不必真正复制数据。

2. 右值引用的语法

T&& var = expression; // 绑定右值

右值引用的核心是“&&”。与左值引用（T&）不同，右值引用可以绑定临时对象（右值），从而捕获即将被销毁的资源。

3. 移动构造函数与移动赋值运算符

class Buffer {
public:
    char* data;
    size_t size;

    // 传统拷贝构造函数
    Buffer(const Buffer& other) : data(new char[other.size]), size(other.size) {
        std::copy(other.data, other.data + size, data);
    }

    // 移动构造函数
    Buffer(Buffer&& other) noexcept : data(other.data), size(other.size) {
        other.data = nullptr; // 解除旧对象的所有权
        other.size = 0;
    }

    // 移动赋值运算符
    Buffer& operator=(Buffer&& other) noexcept {
        if (this != &other) {
            delete[] data;       // 先释放旧资源
            data = other.data;   // 直接转移所有权
            size = other.size;
            other.data = nullptr;
            other.size = 0;
        }
        return *this;
    }

    ~Buffer() { delete[] data; }
};

关键点：

noexcept：移动构造函数和赋值运算符最好声明为 noexcept，以便标准库容器（如 std::vector）在重新分配时能够选择移动而非拷贝。

资源归还：被移动的对象必须保持“合法但空”状态，防止双重释放。

4. std::move 与 std::forward

std::move：将左值强制转换为右值，以触发移动构造函数或移动赋值运算符。语义上仅是类型转换，并不执行移动。
```
Buffer b1;
Buffer b2 = std::move(b1); // 调用移动构造函数
```
std::forward：用于完美转发（perfect forwarding），保持参数的值类别（左值或右值），在模板函数中尤为重要。
```
template<typename T>
void wrapper(T&& arg) {
    target(std::forward <T>(arg)); // 保持原值类别
}
```

5. 标准容器的移动优化

std::vector、std::string、std::unique_ptr 等标准容器已在内部实现移动语义。典型优化包括：

在 push_back 时，若传入的是右值，容器将移动而非拷贝元素。
在 reserve 后重新分配时，容器会移动旧元素至新缓冲区。
std::move_iterator 允许我们将迭代器范围的元素移动到目标容器。

std::vector <Buffer> vec;
vec.reserve(10);
vec.push_back(Buffer()); // 移动构造

6. 常见误区

忽略 noexcept：若移动构造函数抛异常，容器在重新分配时会退回到拷贝，导致性能下降。
错误使用 std::move：误把临时对象或已使用的对象 std::move，会导致悬空指针。
资源泄漏：未在移动后正确置空源对象，可能导致双重释放。

7. 设计模式中的移动语义

工厂模式：工厂函数返回 std::unique_ptr，利用移动语义避免不必要的拷贝。
单例模式：使用 std::move 将配置对象转移到单例内部。
构建者模式：构建者返回 std::move 的结果，保持链式调用的效率。

8. 结语

移动语义与右值引用为 C++ 程序员提供了强大的工具，能显著提升资源管理效率。熟练掌握它们不仅可以让代码更快、更小，还能让你在写标准库容器或自定义容器时获得最佳性能。下一步建议阅读《Effective Modern C++》中相关章节，结合实际项目进行深入实践。

实现自定义智能指针的细节与最佳实践

2026-01-21 作者 stdcpp

在 C++ 中，智能指针是管理资源的重要工具。虽然 std::unique_ptr、std::shared_ptr 等已经为我们提供了常用的实现，但在某些特殊场景下，我们可能需要一个定制化的智能指针。本文将从设计思路、关键实现细节以及常见误区三个方面，系统阐述如何实现一个既安全又高效的自定义智能指针。

一、设计目标

所有权语义：支持独占（类似 unique_ptr）与共享（类似 shared_ptr）两种所有权模式，且可以在编译期选择。
资源回收：使用 RAII 原则，确保对象生命周期结束时自动释放资源。
线程安全：在共享模式下，计数器的增减必须原子化。
可扩展性：支持自定义 deleter、可与 STL 容器配合使用。

二、核心实现

2.1 基础模板

template <typename T, bool Shared = false>
class SmartPtr;

Shared 控制所有权模式。若为 false，实现独占指针；若为 true，实现共享指针。

2.2 独占指针实现

template <typename T>
class SmartPtr<T, false> {
private:
    T* ptr_;
public:
    explicit SmartPtr(T* p = nullptr) noexcept : ptr_(p) {}
    SmartPtr(const SmartPtr&) = delete;
    SmartPtr& operator=(const SmartPtr&) = delete;

    SmartPtr(SmartPtr&& other) noexcept : ptr_(other.ptr_) {
        other.ptr_ = nullptr;
    }
    SmartPtr& operator=(SmartPtr&& other) noexcept {
        reset();
        ptr_ = other.ptr_;
        other.ptr_ = nullptr;
        return *this;
    }

    ~SmartPtr() { reset(); }

    T& operator*() const noexcept { return *ptr_; }
    T* operator->() const noexcept { return ptr_; }
    T* get() const noexcept { return ptr_; }
    explicit operator bool() const noexcept { return ptr_ != nullptr; }

    void reset(T* p = nullptr) noexcept {
        if (ptr_) delete ptr_;
        ptr_ = p;
    }
};

2.3 共享指针实现

共享指针需要一个控制块来维护引用计数与 deleter。实现简化示例：

template <typename T>
class SmartPtr<T, true> {
private:
    struct ControlBlock {
        std::atomic <size_t> count{1};
        T* ptr;
        void (*deleter)(T*) = [](T* p){ delete p; };

        explicit ControlBlock(T* p, void(*d)(T*) = nullptr)
            : ptr(p), deleter(d ? d : [](T* p){ delete p; }) {}
    };

    ControlBlock* cb_;

    void release() noexcept {
        if (!cb_) return;
        if (cb_->count.fetch_sub(1, std::memory_order_acq_rel) == 1) {
            cb_->deleter(cb_->ptr);
            delete cb_;
        }
        cb_ = nullptr;
    }

public:
    explicit SmartPtr(T* p = nullptr, void(*d)(T*) = nullptr) noexcept
        : cb_(p ? new ControlBlock(p, d) : nullptr) {}

    SmartPtr(const SmartPtr& other) noexcept
        : cb_(other.cb_) {
        if (cb_) cb_->count.fetch_add(1, std::memory_order_acq_rel);
    }

    SmartPtr& operator=(const SmartPtr& other) noexcept {
        if (this != &other) {
            release();
            cb_ = other.cb_;
            if (cb_) cb_->count.fetch_add(1, std::memory_order_acq_rel);
        }
        return *this;
    }

    SmartPtr(SmartPtr&& other) noexcept : cb_(other.cb_) {
        other.cb_ = nullptr;
    }

    SmartPtr& operator=(SmartPtr&& other) noexcept {
        if (this != &other) {
            release();
            cb_ = other.cb_;
            other.cb_ = nullptr;
        }
        return *this;
    }

    ~SmartPtr() { release(); }

    T& operator*() const noexcept { return *(cb_->ptr); }
    T* operator->() const noexcept { return cb_->ptr; }
    T* get() const noexcept { return cb_ ? cb_->ptr : nullptr; }
    explicit operator bool() const noexcept { return cb_ && cb_->ptr; }

    size_t use_count() const noexcept { return cb_ ? cb_->count.load(std::memory_order_relaxed) : 0; }
};

2.4 自定义 deleter 支持

通过在 SmartPtr 构造函数中接收 deleter，用户可以实现非 delete 的资源释放方式，例如：

SmartPtr<Foo, true> p(new Foo, [](Foo* f){ f->cleanup(); delete f; });

三、常见误区

拷贝构造时忘记计数
共享指针的拷贝构造必须显式递增引用计数。若未递增，多个指针指向同一对象会导致重复删除。
多线程下计数器不原子
共享指针的计数器若不是原子操作，在并发环境中会产生数据竞争，导致程序崩溃。请使用 std::atomic。
自定义 deleter 与控制块不匹配
如果 deleter 需要额外信息（如引用计数），应在控制块中存储相关成员，或使用 std::shared_ptr 的自定义 deleter/allocator 机制。
忽略异常安全
在构造函数中分配控制块或执行 deleter 时若抛异常，需保证已分配的资源能被正确释放。使用 try-catch 或 RAII 包装器是常见做法。

四、使用示例

struct Resource {
    void release() { std::cout << "Resource released\n"; }
};

int main() {
    // 独占指针
    SmartPtr<Resource, false> up(new Resource);
    // 共享指针
    SmartPtr<Resource, true> sp1(new Resource);
    SmartPtr<Resource, true> sp2 = sp1;
    std::cout << "Use count: " << sp2.use_count() << '\n';

    // 自定义 deleter
    SmartPtr<Resource, true> sp3(new Resource,
                                 [](Resource* r){ r->release(); delete r; });

    return 0;
}

五、总结

自定义智能指针可以在满足特殊需求时提供更大的灵活性。关键在于：

明确所有权语义并保持一致；
正确实现计数器与资源释放逻辑；
在多线程环境下确保原子操作；
提供易用的接口以降低使用成本。

在实际项目中，如果需求不超过标准库所能覆盖的范围，建议优先使用 std::unique_ptr / std::shared_ptr。但在需要特殊 deleter、与旧接口兼容或学习目的时，自定义实现会是一个不错的练手项目。

C++17 中 std::variant 的深层使用技巧

2026-01-21 作者 stdcpp

在 C++17 标准中，std::variant 为我们提供了一种类型安全的联合体实现。它可以存储多种类型中的一种，但只能在运行时访问当前值。下面我们将从底层实现、访问方式、拷贝与移动语义以及与 std::visit 组合的高级用法等方面进行深入剖析，帮助你更好地掌握和运用 std::variant。

1. 何为 `std::variant`？

std::variant<Ts...> 定义了一个类型安全的容器，能够持有 Ts... 之中任意一个类型的值。与传统的 union 不同，variant 通过内部构造函数、析构函数以及类型信息管理机制，保证了类型的正确性和内存安全。

std::variant<int, double, std::string> v;
v = 42;          // 持有 int
v = 3.14;        // 持有 double
v = std::string("hello"); // 持有 string

1.1 内部布局

variant 的实现通常采用以下三块内存：

类型索引 (index_)：std::size_t，记录当前持有的类型在 Ts... 列表中的位置（0 开始），未持有值时为 -1（即 std::variant_npos）。
联合体 (storage_)：使用 std::aligned_storage_t 或类似机制，预留足够空间存放最大尺寸、对齐要求最高的类型。
析构函数指针（可选）：某些实现会在 variant 对象中存储指向对应类型析构函数的指针，以便在切换值时能正确析构旧值。

注意：variant 并不持有指针、引用或任何外部资源，除非其类型本身拥有此类成员。

2. 访问当前值

2.1 `std::get`

`std::get

(v)` 或 `std::get(v)` 可在编译期确定索引或类型。 “`cpp int i = std::get (v); // 成功返回 int，否则抛出 bad_variant_access auto d = std::get (v); // 访问第二个类型 “` > **规则**：如果索引/类型不匹配，`std::get` 会抛出 `std::bad_variant_access`。 ### 2.2 `std::holds_alternative` 检查当前值是否属于某个类型： “`cpp if (std::holds_alternative (v)) { // … } “` ### 2.3 `std::get_if` 安全获取指针形式的访问，若不匹配返回 `nullptr`： “`cpp if (auto p = std::get_if(&v)) { std::cout v{value};` | 直接构造 | 若 `value` 与 `Ts…` 中某个类型兼容，则构造该类型 | | `v = value;` | 赋值 | 若已有值，先析构旧值后构造新值 | | `v.emplace (args…);` | 原位构造 | 直接在内部存储区构造指定类型，避免临时拷贝 | > **拷贝构造**：若 `Ts…` 中的所有类型都可拷贝构造，`variant` 也可拷贝。否则编译错误。 > **移动构造**：同理，只要所有类型可移动即可。 — ## 4. `std::visit` 的强大之处 `std::visit` 通过访客模式实现多态调用，允许你根据当前值执行不同逻辑，而不需要显式的 `if-else` 或 `switch`。 “`cpp auto visitor = [](auto&& arg) -> double { using T = std::decay_t; if constexpr (std::is_same_v) return arg * 1.5; else if constexpr (std::is_same_v) return arg + 3.14; else if constexpr (std::is_same_v) return arg.size(); else return 0.0; }; double result = std::visit(visitor, v); “` > **折叠表达式**：在 C++17 后，可以使用折叠表达式或 `if constexpr` 进一步简化 visitor。 ### 4.1 访问多类型若你想一次访问 `variant` 中的多种可能值，可使用 `std::visit` 并传入多参数： “`cpp std::variant a, b; std::visit([](auto&& x, auto&& y){ std::cout ; Result parse(const std::string& s) { try { return std::stoi(s); // int } catch (…) { try { return s; // string } catch (…) { return std::monostate{}; // 无值 } } } “` > `std::monostate` 作为占位符类型，代表“空值”，与 `optional` 的作用类似，但更灵活。 — ## 6. 典型案例：实现多态日志系统下面给出一个简单的多态日志系统实现，使用 `std::variant` 存储不同日志事件类型。 “`cpp #include #include #include struct LogEvent { struct Info { std::string msg; }; struct Warning { std::string msg; int code; }; struct Error { std::string msg; int errCode; std::string stackTrace; }; }; using LogEntry = std::variant; void handleLog(const LogEntry& entry) { std::visit([](auto&& e){ using T = std::decay_t; if constexpr (std::is_same_v) { std::cout ) { std::cout ) { std::cout v = 3;` 只能匹配 `int` 或 `double`，若传入 `std::string` 编译错误。 – **非拷贝/移动**：若某个成员类型不满足拷贝/移动，`variant` 的相应构造/赋值会被删除。可使用 `std::optional>` 等方式包裹。 – **多重继承**：如果 `Ts…` 中包含多重继承的类，`variant` 的 `emplace` 可能产生二义性。建议使用 `std::variant>` 进行包装。 — ## 8. 小结 – `std::variant` 是一种类型安全的多态容器，适用于需要在运行时切换值类型的场景。 – 通过 `std::visit` 与 `if constexpr`，可以在不使用虚函数的情况下实现高效多态逻辑。 – 与 `std::optional`、`std::shared_ptr` 等配合使用，可实现更灵活的错误处理与资源管理。掌握 `variant` 的细节后，你可以在项目中更自由地表达“不同但相关”的数据结构，而不必陷入繁琐的继承体系。祝你编码愉快！

使用C++20 协程实现异步 I/O 的简易框架

2026-01-21 作者 stdcpp

在传统的同步阻塞 I/O 中，线程在等待 I/O 完成期间会被挂起，导致资源利用率低下。随着 C++20 标准引入协程（co_await、co_return 等关键字），我们可以在单线程或少量线程内实现真正的非阻塞异步 I/O。下面给出一个最小化的示例，演示如何使用 boost::asio（因为它已经原生支持协程）配合 C++20 协程来实现一个 HTTP GET 请求。

1. 准备工作

编译器：需要支持 C++20 的编译器，例如 GCC 11+ 或 Clang 13+。
依赖：安装 boost，特别是 boost::asio。
链接：链接 boost_system 和 boost_coroutine。

# Debian/Ubuntu
sudo apt-get install libboost-all-dev

2. 协程包装器

Boost.Asio 已经提供了 `boost::asio::awaitable

`，它封装了协程上下文和异步操作。我们通过 `co_spawn` 启动协程，并使用 `co_await` 进行异步等待。 “`cpp #include #include #include #include #include #include #include namespace asio = boost::asio; using tcp = asio::ip::tcp; using namespace std::chrono_literals; // 简单的协程包装器：等待给定秒数后打印消息 asio::awaitable delay_print(std::string msg, std::chrono::seconds wait) { asio::steady_timer timer{co_await asio::this_coro::executor, wait}; co_await timer.async_wait(asio::use_awaitable); std::cout http_get(const std::string& host, const std::string& path) { auto executor = co_await asio::this_coro::executor; // 1. 解析域名 tcp::resolver resolver{executor}; auto endpoints = co_await resolver.async_resolve(host, “http”, asio::use_awaitable); // 2. 建立连接 tcp::socket socket{executor}; co_await asio::async_connect(socket, endpoints, asio::use_awaitable); // 3. 发送 HTTP GET 请求 std::string request = “GET ” + path + ” HTTP/1.1\r\n” “Host: ” + host + “\r\n” “Connection: close\r\n\r\n”; co_await asio::async_write(socket, asio::buffer(request), asio::use_awaitable); // 4. 读取响应 asio::streambuf response; std::ostringstream ss; for (;;) { std::size_t n = co_await asio::async_read(socket, response.prepare(1024), asio::transfer_at_least(1), asio::use_awaitable); response.commit(n); std::istream is(&response); ss **说明**：上面的 `for (;;)` 循环在实际使用中会抛出 `boost::system::system_error`（`boost::asio::error::eof`）表示连接已关闭。你可以捕获该异常并返回已收集的数据。 — ## 4. 主函数 “`cpp int main() { asio::io_context io_ctx{1}; // 启动协程 asio::co_spawn(io_ctx, []() -> asio::awaitable { try { std::string body = co_await http_get(“example.com”, “/”); std::cout

深度学习中的C++实现：如何使用CUDA加速张量运算

2026-01-21 作者 stdcpp

在现代深度学习框架中，CPU与GPU之间的协同工作已成为标准做法。C++作为底层语言，在性能关键部件中占据重要位置。本文将介绍如何在C++项目中使用CUDA库，对张量运算进行加速，并给出完整的代码示例与最佳实践。

环境准备
- CUDA Toolkit 12.x（或对应版本）
- cuBLAS、cuDNN（可选）
- CMake 3.18+
- 支持NVCC的编译器（gcc、clang、MSVC等）

项目结构

tensor-cuda/
├── CMakeLists.txt
├── src/
│   ├── main.cpp
│   ├── tensor.hpp
│   └── tensor.cu
└── include/
 └── tensor.hpp

关键代码

tensor.hpp

#pragma once
#include <vector>
#include <cuda_runtime.h>

class Tensor {
public:
    Tensor(const std::vector <int>& shape);
    ~Tensor();

    float* device_ptr() const { return d_data_; }
    const std::vector <int>& shape() const { return shape_; }

    // 简单的矩阵乘法示例
    static Tensor matmul(const Tensor& a, const Tensor& b);

private:
    std::vector <int> shape_;
    float* d_data_;
};

tensor.cu

#include "tensor.hpp"
#include <iostream>

__global__ void matmul_kernel(const float* a, const float* b, float* c,
                              int M, int N, int K) {
    int row = blockIdx.y * blockDim.y + threadIdx.y;
    int col = blockIdx.x * blockDim.x + threadIdx.x;
    if (row < M && col < N) {
        float sum = 0.0f;
        for (int i = 0; i < K; ++i)
            sum += a[row * K + i] * b[i * N + col];
        c[row * N + col] = sum;
    }
}

Tensor Tensor::matmul(const Tensor& a, const Tensor& b) {
    assert(a.shape().size() == 2 && b.shape().size() == 2);
    int M = a.shape()[0], K = a.shape()[1];
    int N = b.shape()[1];
    Tensor result({M, N});

    dim3 blockSize(16, 16);
    dim3 gridSize((N + blockSize.x - 1) / blockSize.x,
                  (M + blockSize.y - 1) / blockSize.y);
    matmul_kernel<<<gridSize, blockSize>>>(a.device_ptr(), b.device_ptr(),
                                           result.device_ptr(), M, N, K);
    cudaDeviceSynchronize();
    return result;
}

main.cpp

#include "tensor.hpp"
#include <iostream>

int main() {
    Tensor A({2, 3});
    Tensor B({3, 4});

    // 这里略过数据初始化，假设已在 GPU 端填充数据
    Tensor C = Tensor::matmul(A, B);

    std::cout << "矩阵乘法完成，结果形状为 (" << C.shape()[0] << ", " << C.shape()[1] << ")\n";
    return 0;
}

CMakeLists.txt

cmake_minimum_required(VERSION 3.18)
project(TensorCUDA LANGUAGES CXX CUDA)

set(CMAKE_CXX_STANDARD 17)
find_package(CUDA REQUIRED)

add_library(tensor SHARED
    src/tensor.cpp
    src/tensor.cu
)

target_include_directories(tensor PUBLIC ${CMAKE_CURRENT_SOURCE_DIR}/include)
target_link_libraries(tensor PUBLIC CUDA::cudart)

add_executable(tensor_demo src/main.cpp)
target_link_libraries(tensor_demo PUBLIC tensor)

编译与运行

mkdir build && cd build
cmake .. -DCMAKE_BUILD_TYPE=Release
make -j$(nproc)
./tensor_demo

性能优化要点
- 内存对齐：使用 cudaMallocPitch 或 cudaMallocManaged 进行对齐，提升内存访问效率。
- 核函数优化：根据 GPU 架构选择合适的线程块尺寸（例如 32 或 64 的倍数），避免 warp 资源浪费。
- 流并行：使用 cudaStream_t 并行执行多个核函数，减少 CPU 等待时间。
- cuBLAS 接口：在实际项目中，可以直接调用 cublasSgemm 进行矩阵乘法，性能更优。
进一步阅读
- 《CUDA by Example》
- 《深入理解 C++ 20 并行 STL》
- 官方 cuBLAS 文档

通过上述示例，你可以在 C++ 项目中轻松实现 GPU 加速的张量运算，为深度学习模型训练和推理提供强大支持。

C++20 中的协程：从概念到实战

2026-01-21 作者 stdcpp

协程（Coroutines）是 C++20 引入的强大语言特性，它们让函数可以在执行过程中挂起并在后续恢复，从而实现异步编程、生成器、事件循环等多种模式。本文将从协程的基本概念入手，逐步演示如何在 C++ 中定义、使用并优化协程。

1. 协程的基本语义

协程本质上是一个可以被多次暂停和恢复的函数。与普通函数不同，协程会在执行到 co_await、co_yield 或 co_return 时挂起，而不是像线程那样切换到另一条执行流。

关键关键词

co_await：挂起当前协程并等待一个 awaitable 对象完成。
co_yield：将一个值返回给调用者，协程挂起，稍后恢复。
co_return：结束协程并返回一个值（如果有返回类型）。

awaitable 对象

一个对象可以被 co_await，只需满足以下两条规则：

operator co_await() 返回一个类型为 Awaiter 的对象。
Awaiter 必须实现 await_ready(), await_suspend(), await_resume() 三个成员函数。

标准库提供了许多 ready-made awaitable，如 std::suspend_always, std::suspend_never，以及 std::experimental::coroutine_handle.

2. 协程的返回类型

协程函数必须返回 std::future、std::promise、std::generator（实验性）或自定义类型。最常见的是 `std::future

`。如果你想实现一个生成器，C++20 里有 `std::generator`（需要包含 “），但在标准库实现还不完全稳定。示例： “`cpp #include #include #include struct Task { struct promise_type { Task get_return_object() { return {}; } std::suspend_always initial_suspend() { return {}; } std::suspend_always final_suspend() noexcept { return {}; } void return_void() {} void unhandled_exception() { std::terminate(); } }; }; Task simple_coroutine() { std::cout #include #include namespace asio = boost::asio; // 或者使用 std::asio using asio::awaitable; using asio::co_spawn; using asio::detached; using asio::use_awaitable; awaitable async_read_file(const std::string& path) { asio::io_context& ctx = co_await asio::this_coro::executor; asio::posix::stream_descriptor file(ctx); std::error_code ec; // 打开文件 file.assign(open(path.c_str(), O_RDONLY), ec); if (ec) { throw std::system_error(ec); } // 读取文件内容 std::vector buffer(1024); std::size_t total = 0; for (;;) { std::size_t n = co_await file.async_read_some(asio::buffer(buffer), use_awaitable); if (n == 0) break; // EOF total += n; // 处理 buffer 前 n 个字节 } file.close(); co_return total; } int main() { asio::io_context ctx; co_spawn(ctx, async_read_file(“test.txt”), [](std::exception_ptr ep) { if (ep) std::rethrow_exception(ep); }); ctx.run(); } “` ### 说明 – `awaitable ` 是一个封装好的协程返回类型，使用 `asio::use_awaitable` 作为完成句柄。 – `co_spawn` 用来在 `io_context` 上执行协程。 – `co_await` 让协程挂起，等待异步 I/O 完成。 ## 4. 性能注意事项 1. **堆栈大小**：协程的挂起点会保存局部状态，通常会在堆上分配栈帧。过多的协程可能导致内存碎片，需要使用 `std::stack` 或 `asio::execution_context` 自定义堆栈管理。 2. **协程对象的拷贝**：默认情况下，协程返回对象是不可移动的，需自定义 `promise_type` 的 `get_return_object` 以返回可移动对象。 3. **异常传播**：在协程中使用 `try/catch` 捕获异常并在 `promise_type` 中通过 `unhandled_exception()` 处理，确保异常能正确传递。 ## 5. 小结 – 协程是 C++20 的重要特性，适用于异步编程、生成器和事件驱动模型。 – 必须使用 `co_await`、`co_yield`、`co_return` 关键字，并返回可协程的类型。 – 通过 `asio::awaitable` 可以与 Boost.Asio 或 libuv 等网络库无缝配合，实现高性能的异步 I/O。 – 在使用协程时需关注堆栈管理、对象移动和异常处理，以获得最佳性能和可维护性。以上内容从基础概念到实际应用，帮助你快速上手 C++20 协程，打造更简洁、高效的异步代码。祝编码愉快！

C++20 模块（Modules）如何提升大型项目构建效率

2026-01-21 作者 stdcpp

模块（Modules）是 C++20 规范中引入的一项重要新特性，旨在解决传统头文件（#include）在大型项目中导致的编译慢、重定义错误以及依赖复杂等问题。本文将从模块的基本概念、构建流程、实际使用示例以及常见坑点四个方面，探讨模块如何显著提升大型项目的构建效率。

1. 模块的核心思想

传统的头文件机制使用预处理器指令 #include 把源文件拷贝到编译单元中，导致同一头文件会被多次编译。模块机制通过把接口和实现分离，生成二进制模块（module interface unit）供其它单元导入。核心概念包括：

模块接口单元（export module MyModule;）：只需编译一次，生成对应的模块图（module graph）文件。
模块实现单元（module MyModule;）：可以在同一模块内部实现多次，类似传统源文件。
导入语句（import MyModule;）：类似 #include，但只会把编译好的接口信息加载到编译单元，避免重复编译。

2. 构建流程简化

使用模块后，构建系统可以：

先编译所有模块接口，生成 .pcm（precompiled module）文件。这个步骤只需要执行一次，后续编译只需读取已生成的二进制文件。
编译实现单元，依赖于已经存在的模块接口，生成目标文件。
链接，将所有目标文件及模块实现链接成可执行或库。

由于接口单元不需要重新编译，且编译器不再执行重复的预处理、语法分析阶段，构建时间可大幅缩短。实际项目中，编译时间从 30 分钟降到 5 分钟甚至更低并不少见。

3. 实际使用示例

下面给出一个简化的例子，演示如何将一个常用的数学库拆分成模块。

3.1 模块接口 `math.ixx`

// math.ixx
export module math;

// 把常用函数放进模块接口
export int add(int a, int b);
export int subtract(int a, int b);
export int multiply(int a, int b);
export double divide(double a, double b);

3.2 模块实现 `math.cpp`

// math.cpp
module math;

// 包含必要头文件
#include <stdexcept>

int add(int a, int b) { return a + b; }
int subtract(int a, int b) { return a - b; }
int multiply(int a, int b) { return a * b; }
double divide(double a, double b) {
    if (b == 0) throw std::invalid_argument("divide by zero");
    return a / b;
}

3.3 使用模块的源文件

// main.cpp
import math;

#include <iostream>

int main() {
    std::cout << "3 + 5 = " << add(3, 5) << '\n';
    std::cout << "10 / 2 = " << divide(10, 2) << '\n';
    return 0;
}

编译指令（以 GCC 为例）：

g++ -std=c++20 -fmodules-ts -c math.cpp -o math.o
g++ -std=c++20 -fmodules-ts -c main.cpp -o main.o
g++ -std=c++20 -fmodules-ts math.o main.o -o app

需要注意的点：

-fmodules-ts 是 GCC 目前实现的模块选项，其他编译器如 Clang 也有类似参数。
编译时 math.cpp 只需要编译一次，后续 main.cpp 只需加载 math 模块接口，省去头文件解析时间。

4. 常见坑点与建议

编译器支持不完全
- 当前 GCC、Clang 对模块的支持仍处于实验阶段，某些编译器版本可能不兼容。建议使用最新版或检查编译器的模块实现状态。
跨平台模块导入
- 模块文件扩展名（如 .pcm）在不同平台上可能不同，构建脚本需根据目标平台适配。
与传统头文件混用
- 如果项目中仍有大量头文件，建议逐步迁移。使用 #pragma GCC push_options / #pragma GCC pop_options 或对应编译器指令控制模块编译。
依赖管理
- 模块可以解决头文件中的宏冲突问题，但在大型项目中仍需要合理划分模块边界，避免出现过度耦合。
构建系统集成
- CMake 3.20+ 已经原生支持 C++20 模块。使用 target_sources 时，指定 PRIVATE 或 INTERFACE 并开启 CXX_STANDARD 为 20。

5. 结论

C++20 模块为大型项目带来了显著的构建效率提升，主要体现在：

减少重复编译：模块接口只编译一次，避免多次 #include 的重复工作。
提升编译器性能：二进制模块不再需要预处理、词法分析和语法分析。
提高代码可维护性：模块化可以更清晰地划分接口与实现，降低宏冲突风险。

虽然目前仍需关注编译器实现的成熟度和构建系统的集成方式，但随着 C++20 规范的普及，模块已成为 C++ 开发者不可忽视的技术。对于希望提升编译速度、降低维护成本的团队而言，逐步迁移到模块化结构将带来长远收益。

1. 局部静态变量（Meyers Singleton）

2. 带锁的单例（显式互斥锁）

3. std::shared_ptr 与 std::weak_ptr 结合

4. 使用 std::atomic 的双检查锁

5. 何时使用哪种实现？

6. 小结

1. Meyers单例（C++11 之后）

2. 带互斥锁的懒汉式（适用于 C++11 之前）

3. 使用 std::call_once

4. 静态唯一实例（带手动销毁）

总结

1. 为什么需要移动语义？

2. 右值引用的语法

3. 移动构造函数与移动赋值运算符

4. std::move 与 std::forward

5. 标准容器的移动优化

6. 常见误区

7. 设计模式中的移动语义

8. 结语

一、设计目标

二、核心实现

2.1 基础模板

2.2 独占指针实现

2.3 共享指针实现

2.4 自定义 deleter 支持

三、常见误区

四、使用示例

五、总结

1. 何为 std::variant？

1.1 内部布局

2. 访问当前值

2.1 std::get

1. 准备工作

2. 协程包装器

1. 协程的基本语义

关键关键词

awaitable 对象

2. 协程的返回类型

1. 模块的核心思想

2. 构建流程简化

3. 实际使用示例

3.1 模块接口 math.ixx

3.2 模块实现 math.cpp

3.3 使用模块的源文件

4. 常见坑点与建议

5. 结论

3. `std::shared_ptr` 与 `std::weak_ptr` 结合

4. 使用 `std::atomic` 的双检查锁

3. 使用 `std::call_once`

1. 何为 `std::variant`？

2.1 `std::get`

3.1 模块接口 `math.ixx`

3.2 模块实现 `math.cpp`