Item35 初稿

This commit is contained in:
wendajiang 2020-06-25 23:31:38 +08:00
parent 87c58e9286
commit a55ec22090

View File

@ -32,4 +32,36 @@ std::thread t(doAsyncWork); // throw if no more
即使没有超出软件线程的限额仍然可能会遇到资源超额的麻烦。如果当前准备运行的软件线程大于硬件线程的数量系统的线程调度程序会将硬件核心的时间切片当一个软件线程的时间片执行结束会让给另一个软件线程即发生上下文切换。软件线程的上下文切换会增加系统的软件线程管理开销并且如果发生了硬件核心漂移这个开销会更高具体来说如果发生了硬件核心漂移1CPU cache中关于上次执行线程的数据很少需要重新加载指令2新线程的cache数据会覆盖老线程的数据如果将来会再次覆盖老线程的数据显然频繁覆盖增加很多切换开销。
避免资源超额是困难的,因为软件线程之于硬件线程的最佳比例取决于软件线程的执行频率,
避免资源超额是困难的因为软件线程之于硬件线程的最佳比例取决于软件线程的执行频率比如一个程序从IO密集型变成计算密集型执行频率是会改变的而且比例还依赖上下文切换的开销以及软件线程对于CPU cache的使用效率。此外硬件线程的数量和CPU cache的速度取决于机器的体系结构即使经过调校软件比例在某一种机器平台取得较好效果换一个其他类型的机器这个调校并不能提供较好效果的保证。
而使用`std::async`可以将调校最优比例这件事隐藏于标准库中,在应用层面不需过多考虑
```cpp
auto fut = std::async(doAsyncWork); // onus of thread mgmt is
// on implement of
// the Standard Library
```
这种调用方式将线程管理的职责转交给C++标准库的开发者。举个例子,这种调用方式会减少抛出资源超额的异常,为何这么说调用`std::async`并不保证开启一个新的线程,只是提供了执行函数的保证,具体是否创建新的线程来运行此函数,取决于具体实现,比如可以通过调度程序来将`AsyncWork`运行在等待此函数结果的线程上,调度程序的合理性决定了系统是否会抛出资源超额的异常,但是这是库开发者需要考虑的事情了。
如果考虑自己实现在等待结果的线程上运行输出结果的函数,之前提到了可能引出负载不均衡的问题,`std::async`运行时的调度程序显然比开发者更清楚调度策略的制定,因为运行时调度程序管理的是所有执行过程,而不仅仅个别开发者运行的代码。
如果在GUI程序中使用`std::async`会引起响应变慢的问题,还可以通过`std::launch::async`向`std::async`传递调度策略来保证运行函数在不同的线程上执行。
最前沿的线程调度算法使用线程池来避免资源超额的问题并且通过窃取算法来提升了跨硬件核心的负载均衡。C++标准实际上并不要求使用线程池或者`work-stealing`算法,而且这些技术的实现难度可能比你想象中更有挑战。不过,库开发者在标准库实现中采用了这些前沿的技术,这使得采用基于任务的方式编程的开发者在这些技术发展中持续获得回报,相反如果开发者直接使用`std::thread`编程,处理资源耗竭,负责均衡问题的责任就压在了应用开发者身上,更不说如何使得开发方案跨平台使用。
对比基于线程的开发方式,基于任务的设计为开发者避免了线程管理的痛苦,并且自然提供了一种获取异步执行的结果的方式。当然,仍然存在一些场景直接使用`std::thread`会更有优势:
- **需要访问非常基础的线程API**。C++并发API通常是通过操作系统提供的系统级API(pthreads 或者 windows threads)来实现的系统级API通常会提供更加灵活的操作方式举个例子C++并发API没有线程优先级和affinities的概念。为了提供对底层系统级线程API的访问`std::thread`对象提供了`native_handle`的成员函数,而在高层抽象的比如`std::futures`没有这种能力。
- **需要优化应用的线程使用**。举个例子只在特定系统平台运行的软件可以调教地比使用C++并行API更好的程序性能。
- **需要实现C++并发API之外的线程技术**。举例来说,自行实现线程池技术。
这些都是在应用开发中并不常见的例子,大多数情况,开发者应该优先采用基于任务的编程方式。
## 总结
- `std::thread`API不能直接访问异步执行的结果如果执行函数有异常抛出代码会终止执行
- 基于线程的编程方式关于解决资源超限,负载均衡的方案移植性不佳
- 基于任务的编程方式`std::async`会默认解决上面两条问题