《OpenACC并行编程实战》—— 第3章 OpenACC计算构件 3.1 条件编译

本节书摘来自华章出版社《openacc并行编程实战》一书中的第3章，第3.1节，作者何沧平，更多章节内容可以访问云栖社区“华章计算机”公众号查看。

程序的加速效果来自于对计算部分的并行化。本章重点介绍计算并行化所用的3个构件：kernels、loop和parallel，以及几个重要的子语。编译器将串行循环映射成并行线程的方式多种多样，需要仔细观察几种常用循环的并行化方式，掌握映射规律。为了演示计算构件的语法和加速效果，3.7节移植常用的jacobi迭代。

特别提醒：用openacc并行化程序的过程中，可能不会立即有加速效果，甚至计算并行化反而使整体运行时间延长。这是正常现象，增加的时间是主机与设备之间的数据传输，不必担忧，第4章会详细讲述如何缩短数据传输时间。

从本章开始，假定读者拥有linux环境下日常操作、编译运行代码的基础，已经成功部署openacc开发环境。linux入门教材推荐《鸟哥的linux私房菜》。本书中所有示例代码均经过测试验证，测试环境有3种：

1）笔记本电脑：英特尔cpu，英伟达geforce gt 420m显卡，windows 7操作系统，pgi workstation 15.10。

2）笔记本电脑：英特尔cpu，英伟达geforce gt 420m显卡，ubuntu 14.04操作系统，pgi workstation 16.3。

3）服务器：两颗英特尔至强cpu，两块英伟达tesla k20m计算卡，red hat enterprise linux 6.2操作系统，pgi workstation 16.3。

英伟达geforce gt 420m拥有96个cuda核心。默认使用第1种环境编辑、调试代码，使用第2种环境获取程序性能、绘制性能图形，第3种环境特别用于计算区域内的过程调用和6.6节单机多卡的情形。

对示例代码的讲述以c语言主为，如无特别需要，只列出fortran版代码，不再讲述重复的语法、技巧。为便于讲述，每行代码都添加了行号，这些行号不是代码的组成部分。

openacc规范要求支持它的编译器预定义一个宏_openacc，宏的值为yyyymm，其中yyyy是编译器所支持openacc版本的发布年份，mm是月份。当且仅当openacc导语功能打开时，编译器必须定义这个宏。openacc 1.0、2.0、2.5版本对应的宏值分别为201111、201306、201509。可以在程序中使用下列语句将宏_openacc的值输出到屏幕上：

结合程序语言的预处理语句，该宏可以增强代码的适应性，请看例3.1。

《OpenACC并行编程实战》—— 第3章 OpenACC计算构件 3.1 条件编译

例3.1第9行中的函数acc_get_num_devices(.)的作用是获取设备的数量，函数功能细节此处不必深究，它的原型包含在头文件openacc.h中，不支持openacc的编译器没有该头文件，因此在第2行使用#ifdef条件包含这个文件，否则不支持openacc的编译器遇到#include语句时将报错。若编译器支持openacc则编译第8～9行，若编译器不支持openacc则编译第11行。

使用不支持openacc的gcc编译器编译：

使用支持openacc的pgi编译器编译，并打开支持选项，在拥有一块英伟达显卡的笔记本上运行，正确给出运行环境中的设备数量：

pgi编译器的c语言编译程序是pgcc，选项-acc的作用是打开编译器对openacc的支持，从而有了编译器定义的宏_openacc，没有选

项

-acc的话，第3、8～9行会被忽略。

fortran代码有个预编译小技巧：fortran语言本身不支持#ifdef等预处理指令，因此要在正式编译前预处理一下，见例3.2。将fortran源码文件的扩展名由通常的小写.f90改为大写的.f90，pgi编译器就会自动添加预处理过程。

pgi编译器的fortran语言编译程序是pgfortran，支持fortran 77/90/95/2003多个版本。使用支持openacc的pgi编译器编译，并打开支持选项-acc，运行结果正确显示拥有1个设备：

《OpenACC并行编程实战》—— 第3章 OpenACC计算构件 3.1 条件编译

继续阅读

C语言：初学者必定看懂的注释！！！猴子吃桃问题。猴子第一天摘下若干个桃子，每天都吃了前一天剩下的一半零一个，到第10天早上想再吃的时候，就剩下一个桃子. 求第一天共摘多少个桃子。

Ubuntu14.04 LTS下安装mongodb

[转]九大排序算法——C语言实现及详解

Nginx服务优化（1）——隐藏版本号、修改用户与组、网页缓存时间、日志切割、连接超时一、隐藏版本号二、修改用户与组三、配置Nginx网页缓存时间四、实现Nginx日志分割五、配置Nginx实现连接超时六、补充关于时间日期的命令

while 循环、do- while 循环和 for 循环之间的那点事C语言自学之三种循环比较

httpd服务的部署、启动、配置和简单优化一、部署二、启动三、配置文件

配置网页内容访问

手动安装Intel network I217-LM网卡的Linux驱动

禁止ubuntu系统弹出报错界面

Ubuntu Linux下Apache的配置文件

结构体：typedef与struct的区别

samba服务器的功能

【Linux】UDP广播报文接收速率问题

Linux设备模型（中）之上层容器

PowerPC平台 Linux移植三

hdu7108哈希