MPI分布内存并行程序开发.ppt

上传人:创****公 文档编号:1608503 上传时间:2019-10-19 格式:PPT 页数:63 大小:246KB
返回 下载 相关 举报
MPI分布内存并行程序开发.ppt_第1页
第1页 / 共63页
MPI分布内存并行程序开发.ppt_第2页
第2页 / 共63页
点击查看更多>>
资源描述

《MPI分布内存并行程序开发.ppt》由会员分享,可在线阅读,更多相关《MPI分布内存并行程序开发.ppt(63页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、MPI分布内存并行程序开发,第四章 点对点通信函数,传送机制(两种):阻塞方式,它必须等到消息从本地送出之后才可以执行后续的语句,保证了缓冲区等资源的可再用性;非阻塞方式,它不须等到消息从本地送出就可以执行后续的语句,但非阻塞调用的返回并不保证资源的可再用性。,阻塞通信正确返回后,其后果是: - 该调用要求的通信操作已正确完成 - 该调用的缓冲区可用 消息信封要匹配 接收到的消息是最早发送的 非阻塞通信主要用于计算和通信的重叠,从而提高整个程序执行的效率。,MPI点对点通信函数的参数格式一般如下所示:,MPI消息传递函数参数,请求(request),这个参数用于非阻塞发送和非阻塞接收操作。由于

2、非阻塞操作返回后,数据可能继续存在缓冲中,由此需要一种机制来检测资源是否可用。根据该变量调用其它函数完成消息的实际发送和接收。在C程序中,这个参数是指向MPI_Request结构的指针。,通讯模式(4种):,标准通信模式(MPI_SEND)缓存通信模式(MPI_BSEND)同步通信模式(MPI_SSEND)就绪通信模式(MPI_RSEND),标准(standard)模式:对数据的缓冲由具体MPI实现决定,与用户程序无关; 发送操作的正确返回而不要求接收操作收到发送的数据。,S,R,1,缓冲区(buffered)模式:用户定义,使用和回收缓冲区,不管接收操作是否启动,发送操作都可以执行,但是必须

3、保证缓冲区可用。,S,R,1,缓冲区,2,同步(synchronous)模式:开始不依赖于接收进程相应的操作是否启动,但必须等到接受开始启动发送才可以返回,S,R,123,就绪(ready)模式:只有当接收操作已经启动时,才可以在发送进程启动发送操作,否则发送将出错。,S,R,12,例3、死锁的发送接收序列,CALL MPI_COMM_RANK(comm,rank,ierr) IF (rank.EQ.0) THEN CALL MPI_RECV(recvbuf,count,MPI_REAL,1, tag,comm,status,ierr) CALL MPI_SEND(sendbuf,count,

4、MPI_REAL,1, tag,comm,ierr) ELSE IF (rank.EQ.1) CALL MPI_RECV(recvbuf,count,MPI_REAL,0, tag,comm,status,ierr) CALL MPI_SEND(sendbuf,count,MPI_REAL,0, tag,comm,ierr) ENDIF,进程 0,进程1,从进程1接收消息A,向进程1发送消息C,从进程0接收消息B,向进程0发送消息D,A,B,C,D,例4、不安全的发送接收序列,CALL MPI_COMM_RANK(comm,rank,ierr) IF (rank.EQ.0) THEN CALL

5、 MPI_SEND(sendbuf,count,MPI_REAL,1, tag,comm,ierr) CALL MPI_RECV(recvbuf,count,MPI_REAL,1, tag,comm,status,ierr) ELSE IF (rank.EQ.1) CALL MPI_SEND(sendbuf,count,MPI_REAL,0, tag,comm,ierr) CALL MPI_RECV(recvbuf,count,MPI_REAL,0, tag,comm,status,ierr) ENDIF,进程 0,进程1,从进程1发送消息A,向进程1接收消息C,从进程0发送消息B,向进程0接

6、收消息D,A,B,C,D,系统缓冲区,程序5、安全的发送接收序列,CALL MPI_COMM_RANK(comm,rank,ierr) IF (rank.EQ.0) THEN CALL MPI_SEND(sendbuf,count,MPI_REAL,1, tag,comm,ierr) CALL MPI_RECV(recvbuf,count,MPI_REAL,1, tag,comm,status,ierr) ELSE IF (rank.EQ.1) CALL MPI_RECV(recvbuf,count,MPI_REAL,0, tag,comm,status,ierr) CALL MPI_SEND

7、(sendbuf,count,MPI_REAL,0, tag,comm,ierr) ENDIF,进程 0,进程1,从进程1发送消息A,向进程1接收消息C,从进程0接收消息B,向进程0发送消息D,A,B,C,D,例子6,clock=(myrank+1)%groupsize;anticlock=(myrank+groupsize-1)%groupsize;MPI_Send(buf1,LENGTH,MPI_CHAR,clock,tag,MPI_COMM_WORLD);MPI_Recv(buf2,LENGTH,MPI_CHAR,anticlock,tag,MPI_COMM_WORLD,0,1,2,改进

8、:,MPI_Isend(buf1,LENGTH,MPI_CHAR,clock,tag,MPI_COMM_WORLD,第五章 集合通信函数,集合通信是包含在通信因子中的所有进程都 参加操作。 集合通信一般实现三个功能 通信:组内数据的传输 同步:组内所有进程在特定的地点在执行 进度上取得一致 计算:对给定的数据完成一定的操作,集合操作的三种类型:同步(barrier):集合中所有进程都到达后,每个进程再接着运行;数据传递:广播(broadcast)、分散(scatter)、收集(gather)、全部到全部(alltoall);规约(reduction):集合中的其中一个进程收集所有进程的数据并计

9、算(如:求最大值、求最小值、加、乘等);,集合通信函数,MPI_BarrierMPI_BcastMPI_ScatterMPI_GatherMPI_ScanMPI_Reduce,MPI_Barrier(),在组中建立一个同步栅栏。当每个进程都到达MPI_Barrier调用后,程序才接着往下执行:MPI_Barrier (comm),程序7、同步示例,#include “mpi.h”#include “test.h”#include #include int main(int argc,char * * argv) int rank,size,I; int *table; int errors=0

10、; MPI_Aint address; MPI_Datatype type,newtype; int lens; MPI_Init( ,/*Make data table */ table =(int *)calloc(size,sizeof(int); tablerank=rank+1; /*准备要广播的数据*/ MPI_Barrier (MPI_COMM_WORLD); /*将数据广播出去*/ for (i=0;isize,i+) MPI_Bcast( ,MPI_Bcast(),从指定的一个根进程中把数据广播发送给组中的所有其它进程:MPI_Bcast (*buffer,count,dat

11、atype,root,comm) 对于root进程:buffer既是接收缓冲又是发送缓冲;对于其他进程:buffer就是接收缓冲。,程序8、广播程序示例,#include #include “mpi.h”int main (argc,argv)int argc;Char * * argv; int rank,value; MPI_Init(,do if (rank=0) /*进程0读入需要广播的数据*/ scanf(“%d”,MPI_Scatter(),把根进程中的数据分散发送给组中的所有进程(包括自己):MPI_Scatter (*sendbuf,sendcnt,sendtype, *rec

12、vbuf, recvcnt,recvtype,root,comm) root用MPI_Send(sendbuf, sendcountn, sendtype, )发送一个消息。这个消息分成n个相等的段,第i个段发送到进程组的第i个进程,sendcnt必须要和recvcnt相同。,MPI_Gather(),在组中指定一个进程收集组中所有进程发送来的消息,这个函数操作与MPI_Scatter函数操作相反:MPI_Gather (*sendbuf,sendcnt,sendtype, *recvbuf, ecvcount,recvtype,root,comm),MPI_Reduce(),在组内所有的进程

13、中,执行一个规约操作,并把结果存放在指定的一个进程中:MPI_Reduce (*sendbuf,*recvbuf,count,datatype, op,root, comm) MPI缺省定义了如下的规约操作,用户可根据自己的需要用MPI_Op_create函数创建新的规约操作:,程序9、规约示例,#include “mpi.h” #include #include double f(double x);/*定义函数f(x) */ return(4.0/(1.0+x*x); int main (int argc,char * argv) int done =0,n,myid,numprocs,i

14、; double PI25DT=3.141592653589793238462643; double mypi,pi,h,sum,x; double startwtime=0.0,endwtime; int namelen; char processor_nameMPI_MAXPROCESSOR_NAME;,MPI_Init(,h=1.0/(double) n; sum=0.0; for(i=myid+1;i=n;i+=numprocs) /* 每一个进程计算一部分矩形的面积,若进程总数numprocs为4, 将 0-1区间划分为100个矩形,则各个进程分别计算矩形块 0进程 1,5,9,13

15、,97 1进程 2,6,10,14,98 2进程 3,7,11,15,99 3进程 4,8,12,16,100 */ x=h*(double)i-0.5); sum+=f(x); mypi=h*sum; /*各进程并行计算得到的部分和*/,/*将部分和累加得到所有矩形的面积,该面积和即为近似PI值*/ MPI_Reduce( ,MPI_Scan(),用来对分布在进程组上的数据执行前缀归约:MPI_Scan (*sendbuf,*recvbuf,count, datatype,op,comm),进程数据缓冲区的变化情况,群集函数的特点:,通讯因子中所有进程都要调用除了MPI_Barrier(),

16、其他函数使用类似标准阻塞的通信模式。一个进程一旦结束了它所参与的群集操作就从群集例程中返回,并不保证其他进程执行该群集例程已经完成。一个群集例程是不是同步操作取决于实现。,MPI并行程序的两种基本模式,对等模式的MPI程序设计主从模式的MPI程序设计,一.对等模式的MPI程序设计,1.问题描述Jacobi迭代 Jacobi迭代是一种比较常见的迭代方法,其核心部分可以用程序1来表示。简单的说,Jacobi迭代得到的新值是原来旧值点相邻数值点的平均。 Jacobi迭代的局部性很好,可以取得很高的并行性。将参加迭代的数据按块分割后,各块之间除了相邻的元素需要通信外,在各块的内部可以完全独立的并行计算

17、。,程序10 串行表示的Jacobi迭代,REAL A(N+1,N+1),B(N+1,N+1)DO K=1,STEP DO J=1,N DO I=1,N B(I,J)=0.25*(A(I-1,J)+A(I+1,J)+A(I,J+1)+A(I,J-1) END DO END DO DO J=1,N DO I=1,N A(I,J)=B(I,J) END DO END DOEND DO,2.用MPI程序实现Jacobi迭代,为了并行求解,这里将参加迭代的数据按列进行分割,假设有4个进程同时并行计算,数据的分割结果如图:,假设需要迭代的数据是M*M的二维数组A(M,M),令M=4*N,按上图进行数据划

18、分,则分布在4个不同进程上的数据分别是: 进程0:A(M,1:N); 进程1:A(M,N+1:2*N); 进程2:A(M,2*N+1:3*N); 进程3:A(M,3*N+1:4*N). 由于在迭代过程中,边界点新值的计算需要相邻边界其他块的数据,因此在每一个数据块的两侧各增加1列的数据空间,用于存放从相邻数据块通信得到的数据。每个数据块的大小就从M*N扩大到M*(N+2)。 计算和通信过程是这样的:首先对数组赋初值,边界赋为8,内部为0。然后开始迭代,迭代之前,每个进程都需要从相邻的进程得到数据块,同时也向相邻的进程提供数据块(FORTRAN数组在内存中是按列优先排列的)。,进程0,进程1,进

19、程2,进程3,发送,发送,发送,发送,发送,发送,接收,接收,接收,接收,接收,接收,程序11、 并行的Jacobi迭代,program maininclude mpif.hinteger totalsize,mysize,stepsParameter (totalsize=16)(定义全局数组的规模)parameter (mysize=totalsize/4,steps=10)integer n,myid,numprocs,i,j,rcReal a(totalsize,mysize+2),b(totalsize,mysize+2)Integer begin_col,end_col,ierrI

20、nteger status(MPI_STATUS_SIZE),call MPI_INIT(ierr)call MPI_COMM_RANK(MPI_COMM_WORLD,myid,ierr)call MPI_COMM_SIZE(MPI_COMM_WORLD,numprocs,ierr)print *,”Process”,myid,” of”,numprocs,” is alive”(数组初始化)do j=1,mysize+2 do i=1,totalsize a(i,j)=0.0 end doend doIf (myid.eq.0) then do i=1,totalsize a(i,2)=8.

21、0 end doend if,If (myid.eq.3) then do i=1,totalsize a(i,mysize+1)=8.0 end doend ifIf (myid.eq.3) then do i=1,totalsize a(i,mysize+1)=8.0 end doend ifdo i=1,mysize+2 a(1,i)=8.0 a(totalsize,i)=8.0end do,(Jacobi迭代部分)do n=1,steps(从右侧的邻居得到数据) if (myid.lt.3)then call MPI_RECV(a(1,mysize+2),totalsize,MPI_R

22、EAL,myid+1, 10,MPI_COMM_WORLD,status,ierr) end if(向左侧的邻居发送数据) if (myid.gt.0)then call MPI_SEND(a(1,2),totalsize,MPI_REAL,myid-1, 10,MPI_COMM_WORLD,ierr) end if,/向右侧的邻居发送数据 if (myid.lt.3) then call MPI_SEND(a(1,mysize+1),totalsize,MPI_REAL,myid+1, 10,MPI_COMM_WORLD,ierr) end if/从左侧的邻居接收数据 if (myid.gt

23、.0) then call MPI_RECV(a(1,1),totalsize,MPI_REAL,myid-1, 10,MPI_COMM_WORLD,status,ierr) end ifbegin_col=2end_col=mysize+1,if (myid.eq.0) then begin_col=3 end ifif (myid.eq.3) then end_col=mysize end ifdo j=begin_col,end_col do i=2,totalsize-1 b(i,j)=0.25*(a(i,j+1)+a(i,j-1)+a(i+1,j)+a(i-1,j) end do e

24、nd do,do j=begin_col,end_col do i=2,totalsize-1 a(i,j)=b(i,j) end doend doend dodo i=2,totalsize-1 print *,myid,(a(i,j),j=begin_col,end_col)end docall MPI_FINALIZE(rc)end,二.主从模式的MPI程序设计,1.问题描述矩阵向量乘 实现矩阵C=A x B 。具体实现方法是:主进程将向量B广播给所有的从进程,然后将矩阵A的各行依次发送给从进程,从进程计算一行和B相乘的结果,然后将结果发送给主进程。主进程循环向各个从进程发送一行的数据,

25、直到将A各行的数据发送完毕。一旦主进程将A的各行发送完毕,则每收到一个结果,就向相应的从进程发送结束标志,从进程接收到结束标志后退出执行。主进程收集完所有的结果后也结束。,发送矩阵A的各行数据回收各行与B相乘的结果,计算,计算,计算,计算,主进程,从进程,送回结果,程序12、 矩阵向量乘,program maininclude “mpif.h”integer MAX_ROWS,MAX_COLS,rows,colsparameter (MAX_ROWS=1000,MAX_COLS=1000)double precision a(MAX_ROWS,MAX_COLS),b(MAX_COLS),c(M

26、AX_COLS)double presicion buffer(MAX_COLS),ansinteger myid,master,numprocs,ierr,status(MPI_STATUS_SIZE)integer i,j,numsent,numrcvd,senderinteger anstype,row,call MPI_INIT(ierr)call MPI_COMM_RANK(MPI_COMM_WORLD,myid,ierr)call MPI_COMM_SIZE(MPI_COMM_WORLD,numprocs,ierr)master=0rows=100cols=100If (myid.

27、eq.master) then (主进程对矩阵A和B赋初值) do i=1,cols b(i)=1 do j=1,rows a(I,j)=1 end do end do,numsent=0 numrcvd=0 (将矩阵B发送给所有其他的从进程,通过下面的广播语句实现) call MPI_BCAST(b,cols,MPI_DOUBLE_PRECISION,master,* MPI_COMM_WORLD,ierr) (依次将矩阵A的各行发送给其他的numprocs-1个从进程) do i=1,min(numprocs-1,rows) do j=1,cols (将一行的数据取出来依次放到缓冲区中)

28、buffer(j)=a(i,j) end do (将准备好的一行数据发送出去) call MPI_SEND(buffer,cols,MPI_DOUBLE_PRECISION,i,i,* MPI_COMM_WORLD,ierr) numsent=numsent+1 end do,(对所有的行,依次接收从进程对一行数据的计算结果) do i=1,row call MPI_RECV(ans,1,MPI_DOUBLE_PRECISION,MPI_ANY_SOURCE,* MPI_ANY_TAG,MPI_COMM_WORLD,status,ierr) sender=status(MPI_SOURCE)

29、anstype=status(MPI_TAG) (将该行数据赋给结果数组C的相应单元) c(anstype)=ans (如果还有其他的行没有被计算,则继续发送) if (numsent.lt.rows) then do j=1,cols (准备好新一行的数据) buffer(j)=a(numsent+1,j) end do (将该行数据发送出去) call MPI_SEND(buffer,cols,MPI_DOUBLE_PRECISION,sender,* numsent+1,MPI_COMM_WORLD,ierr) numsent=numsent+1,else (若所有行都已发送出去,则每接

30、收一个消息则向相应的从进程发 送一个标志为0的空消息,终止该从进程的执行) call MPI_SEND(1.0,0,MPI_DOUBLE_PRECISION,sender,0,* MPI_COMM_WORLD,ierr) end if end doelse (下面为从进程的执行步骤,首先是接收数组B) call MPI_BCAST(b,cols,MPI_DOUBLE_PRECISION,master,* MPI_COMM_WORLD,ierr) (接收主进程发送过来的矩阵A一行的数据) call MPI_RECV(buffer,cols,MPI_DOUBLE_PRECISION,master,

31、* MPI_ANY_TAG,MPI_COMM_WORLD,status,ierr),(若接收到标志为0的消息,则退出执行) if (status(MPI_TAG).ne.0) then row=status(MPI_TAG) ans=0.0 do I=1,cols ans=ans+buffer(i)*b(j) end do (计算一行的结果,并将结果发送给主进程) call MPI_SEND(ans,1,MPI_DOUBLE_PRECISION,master,row, MPI_COMM_WORLD,ierr) goto 90 end ifend if call MPI_FINALIZE(ierr)end,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > pptx模板 > 校园应用

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com