EffectiveModernCppChinese/4.SmartPointers/item20.md

92 lines
9.7 KiB
Markdown
Raw Normal View History

2021-02-19 15:58:22 +08:00
## 条款二十:当`std::shard_ptr`可能悬空时使用`std::weak_ptr`
2019-07-05 16:08:26 +08:00
2021-02-19 15:58:22 +08:00
**Item 20: Use `std::weak_ptr` for `std::shared_ptr`-like pointers that can dangle**
2019-07-05 16:08:26 +08:00
2021-02-19 15:58:22 +08:00
自相矛盾的是,如果有一个像`std::shared_ptr`(见[Item19](https://github.com/kelthuzadx/EffectiveModernCppChinese/blob/master/4.SmartPointers/item19.md))的但是不参与资源所有权共享的指针是很方便的。换句话说,是一个类似`std::shared_ptr`但不影响对象引用计数的指针。这种类型的智能指针必须要解决一个`std::shared_ptr`不存在的问题:可能指向已经销毁的对象。一个真正的智能指针应该跟踪所指对象,在悬空时知晓,悬空(*dangle*)就是指针指向的对象不再存在。这就是对`std::weak_ptr`最精确的描述。
2019-07-06 17:17:06 +08:00
2021-02-19 15:58:22 +08:00
你可能想知道什么时候该用`std::weak_ptr`。你可能想知道关于`std::weak_ptr` API的更多。它什么都好除了不太智能。`std::weak_ptr`不能解引用,也不能测试是否为空值。因为`std::weak_ptr`不是一个独立的智能指针。它是`std::shared_ptr`的增强。
2019-07-06 17:17:06 +08:00
2020-11-01 17:28:51 +08:00
这种关系在它创建之时就建立了。`std::weak_ptr`通常从`std::shared_ptr`上创建。当从`std::shared_ptr`上创建`std::weak_ptr`时两者指向相同的对象,但是`std::weak_ptr`不会影响所指对象的引用计数:
2019-07-06 17:17:06 +08:00
```cpp
2021-02-19 15:58:22 +08:00
auto spw = //spw创建之后指向的Widget的
std::make_shared<Widget>(); //引用计数ref countRC为1。
//std::make_shared的信息参见条款21
2019-07-06 17:17:06 +08:00
2021-02-19 15:58:22 +08:00
std::weak_ptr<Widget> wpw(spw); //wpw指向与spw所指相同的Widget。RC仍为1
2019-07-06 17:17:06 +08:00
2021-02-19 15:58:22 +08:00
spw = nullptr; //RC变为0Widget被销毁。
//wpw现在悬空
2019-07-06 17:17:06 +08:00
```
2021-02-23 19:37:38 +08:00
悬空的`std::weak_ptr`被称作已经**expired**(过期)。你可以用它直接做测试:
2020-11-01 17:28:51 +08:00
2019-07-06 17:17:06 +08:00
```CPP
2021-02-19 15:58:22 +08:00
if (wpw.expired()) … //如果wpw没有指向对象…
2019-07-06 17:17:06 +08:00
```
2021-02-23 19:37:38 +08:00
但是通常你期望的是检查`std::weak_ptr`是否已经过期,如果没有过期则访问其指向的对象。这做起来可不是想着那么简单。因为缺少解引用操作,没有办法写这样的代码。即使有,将检查和解引用分开会引入竞态条件:在调用`expired`和解引用操作之间,另一个线程可能对指向这对象的`std::shared_ptr`重新赋值或者析构,并由此造成对象已析构。这种情况下,你的解引用将会产生未定义行为。
2019-07-06 17:17:06 +08:00
2021-02-23 19:37:38 +08:00
你需要的是一个原子操作检查`std::weak_ptr`是否已经过期,如果没有过期就访问所指对象。这可以通过从`std::weak_ptr`创建`std::shared_ptr`来实现,具体有两种形式可以从`std::weak_ptr`上创建`std::shared_ptr`,具体用哪种取决于`std::weak_ptr`过期时你希望`std::shared_ptr`表现出什么行为。一种形式是`std::weak_ptr::lock`,它返回一个`std::shared_ptr`,如果`std::weak_ptr`过期这个`std::shared_ptr`为空:
2019-10-12 15:06:58 +08:00
```cpp
2021-02-23 19:37:38 +08:00
std::shared_ptr<Widget> spw1 = wpw.lock(); //如果wpw过期spw1就为空
2020-11-01 17:28:51 +08:00
2021-02-19 15:58:22 +08:00
auto spw2 = wpw.lock(); //同上但是使用auto
2019-10-12 15:06:58 +08:00
```
2021-02-23 19:37:38 +08:00
另一种形式是以`std::weak_ptr`为实参构造`std::shared_ptr`。这种情况中,如果`std::weak_ptr`过期,会抛出一个异常:
2019-10-12 15:06:58 +08:00
```cpp
2021-02-23 19:37:38 +08:00
std::shared_ptr<Widget> spw3(wpw); //如果wpw过期抛出std::bad_weak_ptr异常
2019-10-12 15:06:58 +08:00
```
2021-02-19 15:58:22 +08:00
但是你可能还想知道为什么`std::weak_ptr`就有用了。考虑一个工厂函数它基于一个唯一ID从只读对象上产出智能指针。根据[Item18](https://github.com/kelthuzadx/EffectiveModernCppChinese/blob/master/4.SmartPointers/item19.md)的描述,工厂函数会返回一个该对象类型的`std::unique_ptr`
2019-10-12 15:06:58 +08:00
```cpp
2021-02-19 15:58:22 +08:00
std::unique_ptr<const Widget> loadWidget(WidgetID id);
2019-10-12 15:06:58 +08:00
```
2021-02-20 22:46:25 +08:00
如果调用`loadWidget`是一个昂贵的操作比如它操作文件或者数据库I/O并且重复使用ID很常见一个合理的优化是再写一个函数除了完成`loadWidget`做的事情之外再缓存它的结果。当每个请求获取的`Widget`阻塞了缓存也会导致本身性能问题,所以另一个合理的优化可以是当`Widget`不再使用的时候销毁它的缓存。
2019-10-12 15:06:58 +08:00
2021-02-19 15:58:22 +08:00
对于可缓存的工厂函数,返回`std::unique_ptr`不是好的选择。调用者应该接收缓存对象的智能指针,调用者也应该确定这些对象的生命周期,但是缓存本身也需要一个指针指向它所缓存的对象。缓存对象的指针需要知道它是否已经悬空,因为当工厂客户端使用完工厂产生的对象后,对象将被销毁,关联的缓存条目会悬空。所以缓存应该使用`std::weak_ptr`,这可以知道是否已经悬空。这意味着工厂函数返回值类型应该是`std::shared_ptr`,因为只有当对象的生命周期由`std::shared_ptr`管理时,`std::weak_ptr`才能检测到悬空。
2019-10-12 15:06:58 +08:00
2020-11-05 21:39:18 +08:00
下面是一个临时凑合的`loadWidget`的缓存版本的实现:
2019-10-12 15:06:58 +08:00
```cpp
std::shared_ptr<const Widget> fastLoadWidget(WidgetID id)
{
2021-02-19 15:58:22 +08:00
static std::unordered_map<WidgetID,
std::weak_ptr<const Widget>> cache;
//译者注这里std::weak_ptr<const Widget>是高亮
auto objPtr = cache[id].lock(); //objPtr是去缓存对象的
//std::shared_ptr
//当对象不在缓存中时为null
2021-02-20 22:46:25 +08:00
if (!objPtr) { //如果不在缓存中
objPtr = loadWidget(id); //加载它
cache[id] = objPtr; //缓存它
2021-02-19 15:58:22 +08:00
}
return objPtr;
2019-10-12 15:06:58 +08:00
}
2020-11-01 17:28:51 +08:00
```
2020-11-05 21:39:18 +08:00
这个实现使用了C++11的hash表容器`std::unordered_map`,但是需要的`WidgetID`哈希和相等性比较函数在这里没有展示。
2020-11-01 17:28:51 +08:00
2021-02-23 19:39:54 +08:00
`fastLoadWidget`的实现忽略了以下事实:缓存可能会累积过期的`std::weak_ptr`,这些指针对应了不再使用的`Widget`(也已经被销毁了)。其实可以改进实现方式,但是花时间在这个问题上不会让我们对`std::weak_ptr`有更深入的理解让我们考虑第二个用例观察者设计模式Observer design pattern。此模式的主要组件是subjects状态可能会更改的对象和observers状态发生更改时要通知的对象。在大多数实现中每个subject都包含一个数据成员该成员持有指向其observers的指针。这使subjects很容易发布状态更改通知。subjects对控制observers的生命周期即它们什么时候被销毁没有兴趣但是subjects对确保另一件事具有极大的兴趣那事就是一个observer被销毁时不再尝试访问它。一个合理的设计是每个subject持有一个`std::weak_ptr`s容器指向observers因此可以在使用前检查是否已经悬空。
2020-11-01 17:28:51 +08:00
2021-02-19 15:58:22 +08:00
作为最后一个使用`std::weak_ptr`的例子,考虑一个持有三个对象`A`、`B`、`C`的数据结构,`A`和`C`共享`B`的所有权,因此持有`std::shared_ptr`
2020-11-01 17:28:51 +08:00
2021-02-19 15:58:22 +08:00
![item20_fig1](media/item20_fig1.png)
2020-11-01 17:28:51 +08:00
假定从B指向A的指针也很有用。应该使用哪种指针
2021-02-19 15:58:22 +08:00
![item20_fig2](media/item20_fig2.png)
2020-11-01 17:28:51 +08:00
有三种选择:
2021-02-19 15:58:22 +08:00
- **原始指针**。使用这种方法,如果`A`被销毁,但是`C`继续指向`B``B`就会有一个指向`A`的悬空指针。而且`B`不知道指针已经悬空,所以`B`可能会继续访问,就会导致未定义行为。
- **`std::shared_ptr`**。这种设计,`A`和`B`都互相持有对方的`std::shared_ptr`,导致的`std::shared_ptr`环状结构(`A`指向`B``B`指向`A`)阻止`A`和`B`的销毁。甚至`A`和`B`无法从其他数据结构访问了(比如,`C`不再指向`B`每个的引用计数都还是1。如果发生了这种情况`A`和`B`都被泄漏:程序无法访问它们,但是资源并没有被回收。
2021-02-19 15:58:22 +08:00
- **`std::weak_ptr`**。这避免了上述两个问题。如果`A`被销毁,`B`指向它的指针悬空,但是`B`可以检测到这件事。尤其是,尽管`A`和`B`互相指向对方,`B`的指针不会影响`A`的引用计数,因此在没有`std::shared_ptr`指向`A`时不会导致`A`无法被销毁。
2020-11-01 17:28:51 +08:00
2021-02-19 15:58:22 +08:00
使用`std::weak_ptr`显然是这些选择中最好的。但是,需要注意使用`std::weak_ptr`打破`std::shared_ptr`循环并不常见。在严格分层的数据结构比如树中,子节点只被父节点持有。当父节点被销毁时,子节点就被销毁。从父到子的链接关系可以使用`std::unique_ptr`很好的表征。从子到父的反向连接可以使用原始指针安全实现,因为子节点的生命周期肯定短于父节点。因此没有子节点解引用一个悬垂的父节点指针这样的风险。
2020-11-01 17:28:51 +08:00
当然,不是所有的使用指针的数据结构都是严格分层的,所以当发生这种情况时,比如上面所述缓存和观察者列表的实现之类的,知道`std::weak_ptr`随时待命也是不错的。
2020-11-01 17:28:51 +08:00
2021-02-19 15:58:22 +08:00
从效率角度来看,`std::weak_ptr`与`std::shared_ptr`基本相同。两者的大小是相同的,使用相同的控制块(参见[Item19](https://github.com/kelthuzadx/EffectiveModernCppChinese/blob/master/4.SmartPointers/item19.md)),构造、析构、赋值操作涉及引用计数的原子操作。这可能让你感到惊讶,因为本条款开篇就提到`std::weak_ptr`不影响引用计数。我写的是`std::weak_ptr`不参与对象的**共享所有权**,因此不影响**指向对象的引用计数**。实际上在控制块中还是有第二个引用计数,`std::weak_ptr`操作的是第二个引用计数。想了解细节的话,继续看[Item21](https://github.com/kelthuzadx/EffectiveModernCppChinese/blob/master/4.SmartPointers/item21.md)吧。
2020-11-01 17:28:51 +08:00
2021-02-19 15:58:22 +08:00
**请记住:**
2020-11-01 17:28:51 +08:00
2021-01-21 18:03:14 +08:00
- 用`std::weak_ptr`替代可能会悬空的`std::shared_ptr`。
2021-02-19 15:58:22 +08:00
- `std::weak_ptr`的潜在使用场景包括:缓存、观察者列表、打破`std::shared_ptr`环状结构。