与很多同学交流的时候发现,一想到用c++写多线程,还是想到pthread这样的库的方法实现。
但是,十几年前的研究就证明了,线程安全是无法用库的形式来提供的,有兴趣的同学可以参见原文:
<a href="http://www.hpl.hp.com/techreports/2004/hpl-2004-209.pdf">http://www.hpl.hp.com/techreports/2004/hpl-2004-209.pdf</a>
解释需要大量的篇幅,作为快餐式的教程,我们只讲结论。
十几年过去了,cpu的乱序执行,编译器的乱序优化,使得通过pthread一样的库实现线程安全越来越困难。即使做到了,也是以牺牲性能为代价换来的。
我们以java为例,虽然在java 1.0中就支持多线程了。但是,真正完整的线程安全的基础设施的完成是在java 5.0版本中才实现的。这其中最重要的一点,就是java 5.0明确定义了内存模型。有了内存模型的保证,我们才真正知道,什么是可行的,什么是不可行的。如何定义才能在多线程中实在可见性。
在有较大影响的语言中,java是率先达到了这一目标的。c++在当时基本上没有为多线程或者多任务做过考虑,这个问题直到c++11中才被解决掉。
所以,至少对于多线程编程来讲,c++11是必须要学习的。我们不能再停留在c++98/03的老黄历上了!
所幸的是,对于最基本的c++11多任务编程来讲,比起完整学会pthread这样的库还要容易.
然后,我们从c++11的线程开始讲?不,我宁愿把整个内存模型讲完了之后才教您如何使用线程,就怕学完了线程没学内存模型就上手直接开始用了,导致遇到问题之后才知道内存模型的重要性。
但是,这还不是我最想讲的,为什么要学线程和内存模型呢?大部分的任务,我们根本不需要了解什么是线程,什么是锁,更不用说无锁编程之类的了。看过我的《java多线程编程简明教程(1) - future模式与asynctask》都知道,如果有更简单、更高级的封装,我是不建议先学更低级的工具的。
为什么需要多线程?其实很多同学没有意识到,需要的只是多任务,线程只是手段。线程是操作系统级的概念,是操作系统级的资源,我们要管理到这么细节,就得去处理比如管理线程状态,处理线程数满了的异常,如何做线程的负载均衡之类的管理工作,而这些根业务逻辑之间没有半毛钱关系。
从java的发展来看,5.0提供了future模式,7.0中提供了fork-join模式,封装得越来越高级。c++11中暂时还没有到fork-join这么高级,不过,直接调用一个std::async函数就可以实现future模式.
所谓的future模式,就是在后台起一个任务,然后前台该干嘛干嘛,等到前台任务需要用到刚才的后台任务的时候,再去获取后台任务的结果。如果后台任务已经结束了,自然是最好,继续干活就是了。即使后台还没做完,至少也能少等一会儿。不管怎么样都不赔。
c++11如何去做一个后台任务呢,实在太简单了,写个函数,或者仿函数,或者是lambda表达式这样可以被调用的逻辑,然后通过std:async去调用就是了。
唯一需要注意的一点,future模式不允许共享内存,复制一份只读的通过参数传给你的函数吧。
太简单了,一共就只需要4步:
引入头文件
写需要后台执行功能的函数
通过async函数调用上面写的函数
主任务继续干活
需要后台任务的结果时,去读它的返回值
将后台要做事儿的逻辑写成一个函数吧,这里写个最简单的:
大家可以看到,async有多么的简单,第一个参数是马上就启动后台任务,还是用的时候再启动。我们一般都是希望马上启动,于是固定地给launch::async就好了。真的有特殊需求要用的时候再启动,就给launch::deferred。只有这两种情况,简单吧?
第二个参数就是刚才写好的后台逻辑的函数。第三个是您的函数要用的参数。
返回一个future,类型与刚才您写的函数的返回值一致。这时候不需要知道它是什么。
甚至有个更绝情的办法,我们根本不care返回值是什么,直接给个auto让编译器自己推断去。
像下面这样:
不需要懂任何跟线程相关的知识吧?
这个就不多说了,既然要起后台任务,前台肯定有事儿要做。
到了需要返回值的时候,直接调用get函数。本例中是void类型,所以返回值获取了我们也不用。
ok,我们的快餐教程就讲完了,不需要懂什么是线程,什么是锁,什么是内存模型,原子变量是什么,内存都有什么顺序之类的。大家可以快乐地去干活去了~ 等将来我们详详细细地把刚才列举的这些知识一一补齐,大家就会发现这其实是有多复杂了。
java历史上借鉴了太多的c++的东西,但是内存模型和future模式这些,java是领先于c++的。
那我们向java致敬吧,将java多线程简明教程中future模式的例子用c++改写一下。我们看看c++的优势吧:
java写了这么一大坨,c++11只用不到一半的篇幅就搞定了:
或者我们更现代一点,也不要写函数了,直接上一个lambda表达式吧。
最后再强调一遍,输入参数通过函数参数传进去,输出参数通过返回值,也就是future.get获取回来。不要使用全局变量等方式来共享内存!
enjoy it!