C++ 20 模块化编程：从传统头文件到模块系统的演进

在过去的 C++ 发展史中，头文件（.h/.hpp）与源文件（.cpp）的组合一直是构建大型项目的核心。然而，头文件在编译时存在多次包含、依赖循环、编译时间长等缺点。C++20 引入了模块（module）概念，旨在解决这些痛点，并为 C++ 开发者提供更高效、更安全、更可维护的编译模型。

1. 模块的核心概念

模块由两部分组成：

导出模块（exported module）—— 包含可供其他模块使用的接口与实现。
使用模块（importing module）—— 通过 import 关键字导入模块，并使用其导出的符号。

与传统的预处理器 #include 不同，模块通过编译阶段把接口与实现分离，避免了重复编译。

2. 模块与头文件的比较

特性	头文件	模块
编译速度	每个 `.cpp` 需要再次解析头文件，导致重复编译	仅编译一次模块接口，后续只需引用编译好的模块单元
符号污染	头文件常导致全局符号泄漏	模块可以限制可见性，避免不必要的符号暴露
循环依赖	需要 `#pragma once` 或 include guards	模块本身可检测循环依赖，编译器会报错
二进制互操作	需要一致的 ABI	模块化后可直接使用编译好的模块单元，无需再次编译

3. 模块化编程的基本步骤

编写模块接口

// math.mpp
export module math;
export int add(int a, int b);
export int sub(int a, int b);

实现模块

// math_impl.cpp
module math;
int add(int a, int b) { return a + b; }
int sub(int a, int b) { return a - b; }

编译模块

# 编译接口单元
g++ -std=c++20 -fmodules-ts -c math.mpp -o math.pcm
# 编译实现并链接
g++ -std=c++20 -fmodules-ts math_impl.cpp math.pcm -o mathlib.a

在其他文件中使用

import math;
#include <iostream>

int main() {
    std::cout << "add: " << add(3, 4) << '\n';
    std::cout << "sub: " << sub(7, 2) << '\n';
    return 0;
}

4. 模块化的高级应用

4.1 局部模块化（Partial Modules）

在大型项目中，可以将一个模块拆分成多个部分，每个部分只导出一小部分符号，减少编译依赖。编译时只需要重新编译被修改的部分，其他部分保持不变。

4.2 模块与 C API 的桥接

通过 export 关键字，将 C API 包装成模块导出，例如：

export module ffi;
export extern "C" int c_func(int);

使用时仍然保持与 C 语言的兼容性，但享受模块带来的编译优势。

4.3 模块缓存与预编译单元（PCH）

模块编译后生成的 .pcm 文件可被缓存，多次编译时直接使用，类似于预编译头（PCH）。这进一步加速构建过程。

5. 常见坑与建议

不恰当的 export
- 只对需要外部使用的函数、类、命名空间使用 export。过度导出会导致模块体积变大。
宏与模块
- 宏在模块内部可正常使用，但最好避免宏污染模块符号表。若需使用宏，建议在模块接口中限定作用域。
跨平台编译
- 各大编译器对模块支持程度不同。使用 -fmodules-ts 或对应编译器标志时，务必检查目标平台的兼容性。
模块与旧代码的迁移
- 采用“分层”迁移策略：先将核心库转为模块，后续逐步将旧头文件迁移为模块化。

6. 结语

C++20 模块化编程提供了更清晰的编译单元划分，提升了编译效率、降低了符号污染风险。随着编译器对模块支持的成熟，预计在中大型项目中将成为主流的组织方式。未来，随着标准化的进一步完善，C++ 模块将彻底改变我们对 C++ 项目构建的认知。