C++20 中 std::ranges 的新特性与实战示例

C++20 在标准库中引入了 std::ranges 子命名空间，彻底改变了我们对容器、迭代器和算法的使用方式。相比传统的基于迭代器的算法调用，ranges 更加直观、链式、类型安全，并且天然支持懒惰求值。本文将重点介绍 std::ranges 的核心概念、常用工具、以及一个完整的实战示例——用 ranges 处理日志文件并输出按错误级别分组的统计信息。

1. 关键概念回顾

术语	说明	典型代码
view	一个轻量级的、不拥有数据的对象，封装了一段逻辑（如过滤、变换、切片）。可以链式组合，最终产生一个新的 view。	`auto v = std::views::filter([](int x){return x%2==0;});`
view adaptor	作用于已有 view 或容器的函数，返回一个新的 view。	`auto even = std::views::filter(is_even);`
pipeline operator `\|`	让 view 的使用更接近 Unix pipeline，易读。	`auto result = data \| std::views::filter(...) \| std::views::transform(...);`
viewable range	能直接用视图操作的范围，既可以是标准容器也可以是任何符合要求的范围。	`std::vector
v; v	std::views::reverse;`

2. 常用的 view 适配器

适配器	作用	代码示例
`std::views::filter`	过滤元素	`auto evens = data \| std::views::filter([](int x){return x%2==0;});`
`std::views::transform`	转换元素	`auto squares = data \| std::views::transform([](int x){return x*x;});`
`std::views::take`	取前 N 个	`auto first10 = data \| std::views::take(10);`
`std::views::drop`	跳过前 N 个	`auto after5 = data \| std::views::drop(5);`
`std::views::reverse`	反转	`auto rev = data \| std::views::reverse;`
`std::views::concat`	合并两个范围	`auto all = std::views::concat(a, b);`
`std::views::join`	对嵌套范围展开	`auto flat = nested \| std::views::join;`
`std::views::elements`	取 std::pair、std::tuple 的指定元素	`auto firsts = pair_vec	std::views::elements
;`
`std::views::common`	将非常量范围包装为 `std::ranges::common_range`	`auto common = data \| std::views::common;`

3. 典型算法的 ranges 版

传统写法	ranges 版
`std::sort(v.begin(), v.end());`	`v \| std::views::common; std::ranges::sort(v);`
`auto it = std::find(v.begin(), v.end(), key);`	`auto it = std::ranges::find(v, key);`
`for(auto& x : v) { ... }`	`for(auto& x : v \| std::views::common) { ... }`
`auto sum = std::accumulate(v.begin(), v.end(), 0);`	`auto sum = std::reduce(v \| std::views::common, 0);`

小技巧：std::ranges::sort 需要可写迭代器，因此确保使用 std::views::common 或直接操作容器本身。

4. 实战示例：日志文件分级统计

假设我们有一个日志文件，每行格式为：

<时间戳> <级别> <消息>

例如：

2026-01-08 12:00:01 INFO User logged in
2026-01-08 12:00:05 WARN Disk space low
2026-01-08 12:00:10 ERROR Failed to connect

我们想要：

读取文件；
按错误级别（INFO, WARN, ERROR）分组；
统计每个级别出现的次数；
输出结果。

代码实现

#include <iostream>
#include <fstream>
#include <string>
#include <unordered_map>
#include <vector>
#include <ranges>
#include <algorithm>

struct LogEntry {
    std::string timestamp;
    std::string level;
    std::string message;
};

auto parse_line(const std::string& line) -> LogEntry {
    std::istringstream iss(line);
    LogEntry e;
    iss >> e.timestamp >> e.level;
    std::getline(iss, e.message);
    // 去掉前导空格
    if (!e.message.empty() && e.message[0] == ' ') e.message.erase(0, 1);
    return e;
}

auto read_log_file(const std::string& path) -> std::vector <LogEntry> {
    std::ifstream file(path);
    std::vector <LogEntry> entries;
    std::string line;
    while (std::getline(file, line)) {
        if (!line.empty())
            entries.push_back(parse_line(line));
    }
    return entries;
}

int main() {
    auto logs = read_log_file("app.log");

    // 只取 level 字段
    auto levels = logs | std::views::transform([](const LogEntry& e){ return e.level; });

    // 统计
    std::unordered_map<std::string, std::size_t> freq;
    for (const auto& lvl : levels) {
        ++freq[lvl];
    }

    // 输出
    std::cout << "日志级别统计：" << std::endl;
    for (const auto& [lvl, cnt] : freq) {
        std::cout << "  " << lvl << ": " << cnt << " 行" << std::endl;
    }
    return 0;
}

代码解析

读取文件
read_log_file 逐行读取文件并调用 parse_line 解析成 LogEntry 对象。
取出级别
levels 通过 std::views::transform 只提取 level 字段，得到一个视图。
统计
直接遍历 levels 视图，使用 unordered_map 计数。由于视图不持有数据，遍历时是一次性计算，既节省内存又避免了多余拷贝。
输出
用范围-based for 打印统计结果。

扩展

若想按时间窗口统计，只需在 parse_line 解析时将 timestamp 转成 std::chrono::system_clock::time_point，再使用 std::views::filter 结合 std::views::take 或 std::views::drop 实现窗口切割。
若要将结果写回文件，只需在最后遍历 freq 时写入 std::ofstream。

5. 小结

std::ranges 提供了视图（view）和适配器（adaptor）等工具，极大提升了代码的表达力。
通过链式 | 操作，复杂的数据处理流程可以拆解成若干简单的步骤，易于维护。
ranges 的懒惰求值机制可避免不必要的拷贝，尤其在大规模数据处理时显著提升性能。

希望通过本文的示例，你能快速上手 C++20 的 ranges，并在自己的项目中发现更多可能。祝编码愉快！