条款二十:当std::shard_ptr
可能悬空时使用std::weak_ptr
Item 20: Use std::weak_ptr
for std::shared_ptr
-like pointers that can dangle
自相矛盾的是,如果有一个像std::shared_ptr
(见Item19)的但是不参与资源所有权共享的指针是很方便的。换句话说,是一个类似std::shared_ptr
但不影响对象引用计数的指针。这种类型的智能指针必须要解决一个std::shared_ptr
不存在的问题:可能指向已经销毁的对象。一个真正的智能指针应该跟踪所指对象,在悬空时知晓,悬空(dangle)就是指针指向的对象不再存在。这就是对std::weak_ptr
最精确的描述。
你可能想知道什么时候该用std::weak_ptr
。你可能想知道关于std::weak_ptr
API的更多。它什么都好除了不太智能。std::weak_ptr
不能解引用,也不能测试是否为空值。因为std::weak_ptr
不是一个独立的智能指针。它是std::shared_ptr
的增强。
这种关系在它创建之时就建立了。std::weak_ptr
通常从std::shared_ptr
上创建。当从std::shared_ptr
上创建std::weak_ptr
时两者指向相同的对象,但是std::weak_ptr
不会影响所指对象的引用计数:
auto spw = //spw创建之后,指向的Widget的
std::make_shared<Widget>(); //引用计数(ref count,RC)为1。
//std::make_shared的信息参见条款21
…
std::weak_ptr<Widget> wpw(spw); //wpw指向与spw所指相同的Widget。RC仍为1
…
spw = nullptr; //RC变为0,Widget被销毁。
//wpw现在悬空
悬空的std::weak_ptr
被称作已经expired(过期)。你可以用它直接做测试:
if (wpw.expired()) … //如果wpw没有指向对象…
但是通常你期望的是检查std::weak_ptr
是否已经过期,如果没有过期则访问其指向的对象。这做起来可不是想着那么简单。因为缺少解引用操作,没有办法写这样的代码。即使有,将检查和解引用分开会引入竞态条件:在调用expired
和解引用操作之间,另一个线程可能对指向这对象的std::shared_ptr
重新赋值或者析构,并由此造成对象已析构。这种情况下,你的解引用将会产生未定义行为。
你需要的是一个原子操作检查std::weak_ptr
是否已经过期,如果没有过期就访问所指对象。这可以通过从std::weak_ptr
创建std::shared_ptr
来实现,具体有两种形式可以从std::weak_ptr
上创建std::shared_ptr
,具体用哪种取决于std::weak_ptr
过期时你希望std::shared_ptr
表现出什么行为。一种形式是std::weak_ptr::lock
,它返回一个std::shared_ptr
,如果std::weak_ptr
过期这个std::shared_ptr
为空:
std::shared_ptr<Widget> spw1 = wpw.lock(); //如果wpw过期,spw1就为空
auto spw2 = wpw.lock(); //同上,但是使用auto
另一种形式是以std::weak_ptr
为实参构造std::shared_ptr
。这种情况中,如果std::weak_ptr
过期,会抛出一个异常:
std::shared_ptr<Widget> spw3(wpw); //如果wpw过期,抛出std::bad_weak_ptr异常
但是你可能还想知道为什么std::weak_ptr
就有用了。考虑一个工厂函数,它基于一个唯一ID从只读对象上产出智能指针。根据Item18的描述,工厂函数会返回一个该对象类型的std::unique_ptr
:
std::unique_ptr<const Widget> loadWidget(WidgetID id);
如果调用loadWidget
是一个昂贵的操作(比如它操作文件或者数据库I/O)并且重复使用ID很常见,一个合理的优化是再写一个函数除了完成loadWidget
做的事情之外再缓存它的结果。当每个请求获取的Widget
阻塞了缓存也会导致本身性能问题,所以另一个合理的优化可以是当Widget
不再使用的时候销毁它的缓存。
对于可缓存的工厂函数,返回std::unique_ptr
不是好的选择。调用者应该接收缓存对象的智能指针,调用者也应该确定这些对象的生命周期,但是缓存本身也需要一个指针指向它所缓存的对象。缓存对象的指针需要知道它是否已经悬空,因为当工厂客户端使用完工厂产生的对象后,对象将被销毁,关联的缓存条目会悬空。所以缓存应该使用std::weak_ptr
,这可以知道是否已经悬空。这意味着工厂函数返回值类型应该是std::shared_ptr
,因为只有当对象的生命周期由std::shared_ptr
管理时,std::weak_ptr
才能检测到悬空。
下面是一个临时凑合的loadWidget
的缓存版本的实现:
std::shared_ptr<const Widget> fastLoadWidget(WidgetID id)
{
static std::unordered_map<WidgetID,
std::weak_ptr<const Widget>> cache;
//译者注:这里std::weak_ptr<const Widget>是高亮
auto objPtr = cache[id].lock(); //objPtr是去缓存对象的
//std::shared_ptr(或
//当对象不在缓存中时为null)
if (!objPtr) { //如果不在缓存中
objPtr = loadWidget(id); //加载它
cache[id] = objPtr; //缓存它
}
return objPtr;
}
这个实现使用了C++11的hash表容器std::unordered_map
,但是需要的WidgetID
哈希和相等性比较函数在这里没有展示。
fastLoadWidget
的实现忽略了以下事实:缓存可能会累积过期的std::weak_ptr
,这些指针对应了不再使用的Widget
(也已经被销毁了)。其实可以改进实现方式,但是花时间在这个问题上不会让我们对std::weak_ptr
有更深入的理解,让我们考虑第二个用例:观察者设计模式(Observer design pattern)。此模式的主要组件是subjects(状态可能会更改的对象)和observers(状态发生更改时要通知的对象)。在大多数实现中,每个subject都包含一个数据成员,该成员持有指向其observers的指针。这使subjects很容易发布状态更改通知。subjects对控制observers的生命周期(即它们什么时候被销毁)没有兴趣,但是subjects对确保另一件事具有极大的兴趣,那事就是一个observer被销毁时,不再尝试访问它。一个合理的设计是每个subject持有一个std::weak_ptr
s容器指向observers,因此可以在使用前检查是否已经悬空。
作为最后一个使用std::weak_ptr
的例子,考虑一个持有三个对象A
、B
、C
的数据结构,A
和C
共享B
的所有权,因此持有std::shared_ptr
:
假定从B指向A的指针也很有用。应该使用哪种指针?
有三种选择:
- 原始指针。使用这种方法,如果
A
被销毁,但是C
继续指向B
,B
就会有一个指向A
的悬空指针。而且B
不知道指针已经悬空,所以B
可能会继续访问,就会导致未定义行为。 std::shared_ptr
。这种设计,A
和B
都互相持有对方的std::shared_ptr
,导致的std::shared_ptr
环状结构(A
指向B
,B
指向A
)阻止A
和B
的销毁。甚至A
和B
无法从其他数据结构访问了(比如,C
不再指向B
),每个的引用计数都还是1。如果发生了这种情况,A
和B
都被泄漏:程序无法访问它们,但是资源并没有被回收。std::weak_ptr
。这避免了上述两个问题。如果A
被销毁,B
指向它的指针悬空,但是B
可以检测到这件事。尤其是,尽管A
和B
互相指向对方,B
的指针不会影响A
的引用计数,因此在没有std::shared_ptr
指向A
时不会导致A
无法被销毁。
使用std::weak_ptr
显然是这些选择中最好的。但是,需要注意使用std::weak_ptr
打破std::shared_ptr
循环并不常见。在严格分层的数据结构比如树中,子节点只被父节点持有。当父节点被销毁时,子节点就被销毁。从父到子的链接关系可以使用std::unique_ptr
很好的表征。从子到父的反向连接可以使用原始指针安全实现,因为子节点的生命周期肯定短于父节点。因此没有子节点解引用一个悬垂的父节点指针这样的风险。
当然,不是所有的使用指针的数据结构都是严格分层的,所以当发生这种情况时,比如上面所述缓存和观察者列表的实现之类的,知道std::weak_ptr
随时待命也是不错的。
从效率角度来看,std::weak_ptr
与std::shared_ptr
基本相同。两者的大小是相同的,使用相同的控制块(参见Item19),构造、析构、赋值操作涉及引用计数的原子操作。这可能让你感到惊讶,因为本条款开篇就提到std::weak_ptr
不影响引用计数。我写的是std::weak_ptr
不参与对象的共享所有权,因此不影响指向对象的引用计数。实际上在控制块中还是有第二个引用计数,std::weak_ptr
操作的是第二个引用计数。想了解细节的话,继续看Item21吧。
请记住:
- 用
std::weak_ptr
替代可能会悬空的std::shared_ptr
。 std::weak_ptr
的潜在使用场景包括:缓存、观察者列表、打破std::shared_ptr
环状结构。