EffectiveModernCppChinese/5.RRefMovSemPerfForw/item24.md

156 lines
11 KiB
Markdown
Raw Normal View History

2021-02-23 22:35:10 +08:00
## 条款二十四:区分通用引用与右值引用
2019-08-02 22:09:13 +08:00
2021-02-23 22:35:10 +08:00
**Item 24: Distinguish universal references from rvalue references**
2019-08-02 22:09:13 +08:00
2021-02-23 22:35:10 +08:00
据说真相使人自由然而在特定的环境下一个精心挑选的谎言也同样使人解放。这一条款就是这样一个谎言。因为我们在和软件打交道然而让我们避开“谎言lie”这个词不妨说本条款包含了一种“抽象abstraction”。
为了声明一个指向某个类型`T`的右值引用,你写下了`T&&`。由此,一个合理的假设是,当你看到一个“`T&&`”出现在源码中,你看到的是一个右值引用。唉,事情并不如此简单:
2019-08-02 22:09:13 +08:00
```cpp
2021-02-23 22:35:10 +08:00
void f(Widget&& param); //右值引用
Widget&& var1 = Widget(); //右值引用
auto&& var2 = var1; //不是右值引用
2019-08-02 22:09:13 +08:00
2021-02-23 22:35:10 +08:00
template<typename T>
void f(std::vector<T>&& param); //右值引用
2019-08-02 22:09:13 +08:00
2021-02-23 22:35:10 +08:00
template<typename T>
void f(T&& param); //不是右值引用
2019-08-02 22:09:13 +08:00
```
2021-02-23 22:35:10 +08:00
事实上,“`T&&`”有两种不同的意思。第一种,当然是右值引用。这种引用表现得正如你所期待的那样:它们只绑定到右值上,并且它们主要的存在原因就是为了声明某个对象可以被移动。
2019-08-02 22:09:13 +08:00
2021-02-23 22:35:10 +08:00
“`T&&`”的第二层意思,是它既可以是一个右值引用,也可以是一个左值引用。这种引用在源码里看起来像右值引用(也即“`T&&`”),但是它们可以表现得它们像是左值引用(也即“`T&`”)。它们的二重性使它们既可以绑定到右值上(就像右值引用),也可以绑定到左值上(就像左值引用)。 此外,它们还可以绑定到`const`和non-`const`的对象上,也可以绑定到`volatile`和non-`volatile`的对象上,甚至可以绑定到即`const`又`volatile`的对象上。它们可以绑定到几乎任何东西。这种空前灵活的引用值得拥有自己的名字。我把它叫做**通用引用***universal references*)。([Item25](https://github.com/kelthuzadx/EffectiveModernCppChinese/blob/master/5.RRefMovSemPerfForw/item25.md)解释了`std::forward`几乎总是可以应用到通用引用上并且在这本书即将出版之际一些C++社区的成员已经开始将这种通用引用称之为**转发引用***forwarding references*))。
2019-08-02 22:09:13 +08:00
2021-02-23 22:35:10 +08:00
在两种情况下会出现通用引用。最常见的一种是函数模板形参,正如在之前的示例代码中所出现的例子:
2019-08-02 22:09:13 +08:00
```cpp
2021-02-23 22:35:10 +08:00
template<typename T>
void f(T&& param); //param是一个通用引用
2019-08-02 22:09:13 +08:00
```
2021-02-23 22:35:10 +08:00
第二种情况是`auto`声明符,包含从以上示例中取得的这个例子:
2019-08-02 22:09:13 +08:00
```cpp
2021-02-23 22:35:10 +08:00
auto&& val2 = var1; //var2是一个通用引用
2019-08-02 22:09:13 +08:00
```
2021-02-23 22:35:10 +08:00
这两种情况的共同之处就是都存在**类型推导***type deduction*)。在模板`f`的内部,`param`的类型需要被推导,而在变量`var2`的声明中,`var2`的类型也需要被推导。同以下的例子相比较(同样来自于上面的示例代码),下面的例子不带有类型推导。如果你看见“`T&&`”不带有类型推导,那么你看到的就是一个右值引用:
2019-08-02 22:09:13 +08:00
```cpp
2021-02-23 22:35:10 +08:00
void f(Widget&& param); //没有类型推导,
2019-08-02 22:09:13 +08:00
//param是一个右值引用
2021-02-23 22:35:10 +08:00
Widget&& var1 = Widget(); //没有类型推导,
2019-08-02 22:09:13 +08:00
//var1是一个右值引用
```
2021-02-23 22:35:10 +08:00
因为通用引用是引用,所以他们必须被初始化。一个通用引用的初始值决定了它是代表了右值引用还是左值引用。如果初始值是一个右值,那么通用引用就会是对应的右值引用,如果初始值是一个左值,那么通用引用就会是一个左值引用。对那些是函数形参的通用引用来说,初始值在调用函数的时候被提供:
2019-08-02 22:09:13 +08:00
```cpp
2021-02-23 22:35:10 +08:00
template<typename T>
2019-08-02 22:09:13 +08:00
void f(T&& param); //param是一个通用引用
Widget w;
2021-02-23 22:35:10 +08:00
f(w); //传递给函数f一个左值param的类型
//将会是Widget&,也即左值引用
2019-08-02 22:09:13 +08:00
2021-02-23 22:35:10 +08:00
f(std::move(w)); //传递给f一个右值param的类型会是
//Widget&&,即右值引用
2019-08-02 22:09:13 +08:00
```
2021-02-23 22:35:10 +08:00
对一个通用引用而言,类型推导是必要的,但是它还不够。声明引用的**格式**必须正确,并且这种格式是被限制的。它必须是准确的“`T&&`”。再看看之前我们已经看过的代码示例:
2019-08-02 22:09:13 +08:00
```cpp
template <typename T>
void f(std::vector<T>&& param); //param是一个右值引用
```
2021-02-23 22:35:10 +08:00
当函数`f`被调用的时候,类型`T`会被推导(除非调用者显式地指定它,这种边缘情况我们不考虑)。但是`param`的类型声明并不是`T&&`,而是一个`std::vector<T>&&`。这排除了`param`是一个通用引用的可能性。`param`因此是一个右值引用——当你向函数`f`传递一个左值时,你的编译器将会开心地帮你确认这一点:
2019-08-02 22:09:13 +08:00
```cpp
2021-02-23 22:35:10 +08:00
std::vector<int> v;
f(v); //错误!不能将左值绑定到右值引用
2019-08-02 22:09:13 +08:00
```
即使是出现一个简单的`const`修饰符,也足以使一个引用失去成为通用引用的资格:
```cpp
2021-02-23 22:35:10 +08:00
template <typename T>
void f(const T&& param); //param是一个右值引用
2019-08-02 22:09:13 +08:00
```
2021-02-23 22:35:10 +08:00
如果你在一个模板里面看见了一个函数形参类型为“`T&&`”,你也许觉得你可以假定它是一个通用引用。错!这是由于在模板内部并不保证一定会发生类型推导。考虑如下`push_back`成员函数,来自`std::vector`
2019-08-02 22:09:13 +08:00
```cpp
2021-02-23 22:35:10 +08:00
template<class T, class Allocator = allocator<T>> //来自C++标准
class vector
{
public:
void push_back(T&& x);
}
2019-08-02 22:09:13 +08:00
```
2021-02-28 15:02:21 +08:00
`push_back`函数的形参当然有一个通用引用的正确形式,然而,在这里并没有发生类型推导。因为`push_back`在有一个特定的`vector`实例之前不可能存在,而实例化`vector`时的类型已经决定了`push_back`的声明。也就是说,
2019-08-02 22:09:13 +08:00
```cpp
2021-02-23 22:35:10 +08:00
std::vector<Widget> v;
2019-08-02 22:09:13 +08:00
```
2021-02-23 22:35:10 +08:00
将会导致`std::vector`模板被实例化为以下代码:
2019-08-02 22:09:13 +08:00
```cpp
2021-02-23 22:35:10 +08:00
class vector<Widget, allocator<Widget>> {
public:
void push_back(Widget&& x); //右值引用
};
2019-08-02 22:09:13 +08:00
```
2021-02-23 22:35:10 +08:00
现在你可以清楚地看到,函数`push_back`不包含任何类型推导。`push_back`对于`vector<T>`而言有两个函数——它被重载了总是声明了一个类型为rvalue-reference-to-`T`的形参。
2019-08-02 22:09:13 +08:00
相反,`std::vector`内部的概念上相似的成员函数`emplace_back`,却确实包含类型推导:
```cpp
2021-02-23 22:35:10 +08:00
template<class T, class Allocator = allocator<T>> //依旧来自C++标准
class vector {
public:
template <class... Args>
void emplace_back(Args&&... args);
};
2019-08-02 22:09:13 +08:00
```
2021-02-28 15:02:21 +08:00
这儿,类型形参`Args`是独立于`vector`的类型形参`T`之外的,所以`Args`会在每次`emplace_back`被调用的时候被推导。(好吧,`Args`实际上是一个参数包,而不是一个类型形参,但是为了讨论之利,我们可以把它当作是一个类型形参。)
2019-08-02 22:09:13 +08:00
2021-02-28 15:02:21 +08:00
虽然函数`emplace_back`的类型形参被命名为`Args`,但是它仍然是一个通用引用,这补充了我之前所说的,通用引用的格式必须是“`T&&`”。 没有任何规定必须使用名字`T`。举个例子,如下模板接受一个通用引用,因为格式(“`type&&`”)是正确的,并且`param`的类型将会被推导(重复一次,不考虑边缘情况,也即当调用者明确给定类型的时候)。
2019-08-02 22:09:13 +08:00
2019-08-03 22:02:14 +08:00
```cpp
2021-02-23 22:35:10 +08:00
template<typename MyTemplateType> //param是通用引用
2019-08-03 22:02:14 +08:00
void someFunc(MyTemplateType&& param);
```
2021-02-28 15:02:21 +08:00
我之前提到,类型为`auto`的变量可以是通用引用。更准确地说,类型声明为`auto&&`的变量是通用引用,因为会发生类型推导,并且它们满足正确的格式要求(`T&&`)。`auto`类型的通用引用不如函数模板形参中的通用引用常见但是它们在C++11中常常突然出现。而它们在C++14中出现得更多因为C++14的*lambda*表达式可以声明`auto&&`类型的形参。举个例子如果你想写一个C++14标准的*lambda*表达式,来记录任意函数调用花费的时间,你可以这样:
2019-08-03 22:02:14 +08:00
```cpp
2021-02-23 22:35:10 +08:00
auto timeFuncInvocation =
[](auto&& func, auto&&... params) //C++14
2019-08-03 22:02:14 +08:00
{
start timer;
2021-02-28 15:02:21 +08:00
std::forward<decltype(func)>(func)( //对params调用func
2019-08-03 22:02:14 +08:00
std::forward<delctype(params)>(params)...
);
stop timer and record elapsed time;
};
```
2021-02-23 22:35:10 +08:00
如果你对位于匿名函数里的“`std::forward<decltype(blah blah blah)>`”反应是“What the...?!”,这只代表着你可能还没有读[Item33](https://github.com/kelthuzadx/EffectiveModernCppChinese/blob/master/6.LambdaExpressions/item33.md)。别担心。在本条款,重要的事是*lambda*声明的`auto&&`类型的形参。`func`是一个通用引用,可以被绑定到任何可被调用的对象,无论左值还是右值。`args`是0个或者多个通用引用也就是说它是个通用引用参数包它可以绑定到任意数目、任意类型的对象上。多亏了`auto`类型的通用引用,函数`timeFuncInvocation`可以对**近乎任意**pretty much any函数进行计时。(如果你想知道任意any和近乎任意pretty much any的区别往后翻到[Item30](https://github.com/kelthuzadx/EffectiveModernCppChinese/blob/master/5.RRefMovSemPerfForw/item30.md))。
2019-08-03 22:02:14 +08:00
2021-02-23 22:35:10 +08:00
牢记整个本条款——通用引用的基础——是一个谎言,啊,一个“抽象”。隐藏在其底下的真相被称为**引用折叠***reference collapsing*[Item28](https://github.com/kelthuzadx/EffectiveModernCppChinese/blob/master/5.RRefMovSemPerfForw/item28.md)致力于讨论它。但是这个真相并不降低该抽象的有用程度。区分右值引用和通用引用将会帮助你更准确地阅读代码(“究竟我眼前的这个`T&&`是只绑定到右值还是可以绑定任意对象呢?”),并且,当你在和你的合作者交流时,它会帮助你避免歧义(“在这里我在用一个通用引用,而非右值引用……”)。它也可以帮助你弄懂[Item25](https://github.com/kelthuzadx/EffectiveModernCppChinese/blob/master/5.RRefMovSemPerfForw/item25.md)和[26](https://github.com/kelthuzadx/EffectiveModernCppChinese/blob/master/5.RRefMovSemPerfForw/item26.md),它们依赖于右值引用和通用引用的区别。所以,拥抱这份抽象,陶醉于它吧。就像牛顿的力学定律(本质上不正确),比起爱因斯坦的广义相对论(这是真相)而言,往往更简单,更易用。所以这份通用引用的概念,相较于穷究引用折叠的细节而言,是更合意之选。
2019-08-03 22:02:14 +08:00
2021-02-23 22:35:10 +08:00
**请记住:**
2019-08-02 22:09:13 +08:00
2021-02-23 22:35:10 +08:00
- 如果一个函数模板形参的类型为`T&&`,并且`T`需要被推导得知,或者如果一个对象被声明为`auto&&`,这个形参或者对象就是一个通用引用。
2019-08-03 22:02:14 +08:00
- 如果类型声明的形式不是标准的`type&&`,或者如果类型推导没有发生,那么`type&&`代表一个右值引用。
2021-02-23 22:35:10 +08:00
- 通用引用,如果它被右值初始化,就会对应地成为右值引用;如果它被左值初始化,就会成为左值引用。
2019-08-02 22:09:13 +08:00