Fluent C++：Ranges:STL的高级用法

作者: sunix | 来源:发表于2020-03-19 22:02 被阅读0次

Fluent C++：Ranges:STL的高级用法
C++20
Fluent C++:前言
c++ typename
Cython系列教程：四.在Cython中使用c++
C++ vector用法初记
读书笔记17.06.03
[C++] STL 容器
C++ STL vector用法
Fluent C++：了解STL 算法库的

正如在一篇专门的帖子中看到的，C++标准模板库（STL）是一个神奇的工具，它使代码更加正确和富有表现力。主要分为两部分：

容器，例如std::vector或者std::map等。
算法，大多数用来操作容器的众多通用函数。它们大多在<algorithm>头文件中找到。

对于很多使用for循环遍历容器的手工操作都可以用调用STL的算法来代替。这样做的效果是使代码更清晰，因为代码的阅读者不必在脑海中分析复杂的for循环，只要将循环语句用std::copy，std::partition或者std::rotate等显式名称代替，就可以立即理解所发生的事情。

然而，STL有几个方面可以改进。在本帖中，我们将重点讨论其中的两个问题：

所有算法操作指向它们所操作的容器的迭代器。虽然在一些特殊的情况下，如在容器的某一精确点停止，这样做很方便，但通常的情况是遍历整个容器，从它的.begin ()到它的.end ()。使用STL的代码部分最终会充满迭代器：
```
std::copy(v1.begin(), v1.end(), std::back_inserter(v2));
std::set_difference(v2.begin(), v2.end(), v3.begin(), v3.end(), std::back_inserter(v4));
std::transform(v3.begin(), v3.end(), std::back_inserter(v4));
```
(注：上面使用的std::back_inserter是一个输出迭代器，它每次被分配给容器时，都使用容器的push_back方法。这减轻了程序员对输出大小的估量)
算法不好组合使用。我发现使用STL的C++开发人员经常遇到的一个需求是，只在容器中满足谓词的元素上应用函数。对容器输入的所有元素应用函数f并将结果放入vector中输出是通过std::transform：
```
std::transform(input.begin(), input.end(), std::back_inserter(output), f);
```
根据谓词p过滤元素是使用std::copy_if：
```
std::copy_if(input.begin(), input.end(), std::back_inserter(output), p);
```
但是，要合并这两个调用并不容易，也没有“transform_if”算法这样的东西。

ranges以一种非常优雅的方式来解决STL的这两个问题。ranges最初是在Boost中引入的，现在正在走向标准化。我相信它们将对我们处理代码中容器的方式产生重大影响。

Range的概念

Range的概念是重中之重。从本质上讲，Range是可以遍历的东西。更确切地说，Range是一个包含begin()和end()方法的东西，它返回对象（迭代器）来允许你遍历Range（即沿着Range的元素移动，并以解引用的方式访问这些元素）。

用伪代码表示的Range符合以下接口：

Range
{
    begin()
    end()
}

请注意，这意味着所有STL容器本身都是Range。

在定义Range概念之前，使用STL的代码已经以某种方式使用了Range，但是使用起来很笨拙。正如本文开头所看到的，它们直接由两个迭代器操作，典型的一个begin，一个end。但是对于Range，通常看不到迭代器。他们在这里，但被Range的概念所抽象化。

理解这一点很重要。迭代器是允许你对容器进行迭代的技术性数据结构，但它们通常对于函数代码来说太技术性了。在大多数情况下，你真正想表示的是一个范围，它更符合代码的抽象级别。就像现金流的范围，屏幕上的行的范围，或者从数据库中出来的条目的范围。

因此，从range的角度进行编码是一个巨大的改进，因为从这个意义上说迭代器违反了尊重抽象层次的原则，我认为这是设计好代码最重要的原则。

在range库中，STL算法被重新定义，以直接将range作为参数，而不是两个迭代器，例如：

ranges::transform(input, std::back_inserter(output), f);

而不是：

std::transform(input.begin(), input.end(), std::back_inserter(output), f);

此类算法在实现中重用STL版本，方法是将range的begin和end转发给原始STL版本。

智能迭代器

尽管用range做了抽象了，但是range遍历还是用迭代器实现的。range的全部能力来自它与智能迭代器的组合。一般来说，容器的迭代器有两个职责：

沿着容器的元素移动（++、--等）
访问容器元素(*, ->)

例如，一个vector迭代器可以完成这个任务。但是源于boost的“智能”迭代器定制了其中一种或两种行为。例如：

transform_iterator由另一个迭代器it和一个函数（或函数对象）f构造，并自定义它访问元素的方式：当解引用时，transform_iterator将f应用到*it并返回结果。
filter_iterator由另一个迭代器it和一个谓词p构造。它定制它的移动方式：当向前移动一个( ++ ) filter_iterator时，它向前移动它的基础迭代器，直到它到达满足谓词或容器结尾的元素。

结合range和智能迭代器：range适配器

range的全部能力来自它们与智能迭代器的关联。这是用range适配器完成的。

range适配器是一种对象，它可以与range组合以产生新的range。它们的一个子部分是视图适配器：对于它们，初始的被适配的range保持不变，而生成的range不包含元素，因为它与初始range相比更像是视图，但具有定制的迭代行为。

为了说明这一点，我们以view::transformadaptor为例。这个适配器用一个函数初始化，并且可以与一个range组合以产生一个视图，这个视图具有一个transform_iterator在这个范围内的迭代行为。range适配器可以与range结合使用，使用运算符|，这为它们提供了优雅的语法。

使用如下的数字容器：

std::vector numbers = { 1, 2, 3, 4, 5 };

range:

auto range = numbers | view::transform(multiplyBy2);

是具有transform_iterator的迭代行为的数字容器的视图，其函数为multiplyBy2。所以当你遍历这个视图时，你得到的结果就是这些数字乘以2。例如：

ranges::accumulate(numbers | view::transform(multiplyBy2), 0);

返回12 + 22 + 32 + 42 + 5*2 = 30 (类似 std::accumulate).

还有许多其他range适配器。例如，view::filter接受一个谓词，并且可以与range组合以通过filter_iterator的行为在谓词上构建视图：

ranges::accumulate(numbers | view::filter(isEven), 0);

返回 22 + 42 = 12。这为最初不能将算法组合在一起的问题提供了一个解决方案。

结论

Range提高了使用STL的抽象级别，通过删除多余的迭代器来清理代码。Range适配器是一种非常强大和富有表达性的工具，它以模块化的方式对容器的元素进行操作。

Range是STL的未来。要进一步了解，你可以查看一下初始range库，或者看看EricNiebler的标准化提案。由于该提案依赖于C++17中未包含的概念，因此range尚未标准化。在此之前，你可以深入研究Eric Niebler的range库range-v3 ，它与C++语言的当前版本兼容。它可在VisualStudio2015Update3中找到，并带有流行的range-v3库的分支。