20春学期(1709、1803、1809、1903、1909、2003)《并行程序设计》在线作业

n个数求和的串行程序,通过一个循环将每个数累加到全局变量sum中,其多线程版本简单将循环范围改变为每个线程负载的范围,存在的问题是____。
A:负载不均
B:通信开销大
C:CPU空闲等待严重
D:sum累加产生竞争条件,导致结果错误
答案:D

采用划分子矩阵方法实现矩阵乘法,在进行SSE并行化时,是对(由外至内数)第____层循环进行循环展开然后向量化。
A:3
B:4
C:5
D:6
答案:D

OpenMP是___的一个常见替代。
A:SSE
B:MPI
C:Pthread
D:CUDA
答案:C

采用划分子矩阵技术优化矩阵乘法CUDA程序,主要思想是访存更多在____。
A:CPU内存
B:GPU显存
C:GPU共享内存
D:GPU寄存器
答案:C

pthread_rwlock_wrlock是对读写锁进行____操作。
A:加锁
B:解锁
C:加读琐
D:加写锁
答案:D

SSE数据移动指令分类不包括____。
A:对齐传输
B:未对齐传输
C:标量传输
D:缓存传输
答案:D

SSE intrinsics _mm_load_pd命令的功能是____。
A:对齐向量读取单精度浮点数
B:未对齐向量读取单精度浮点数
C:对齐向量读取双精度浮点数
D:未对齐向量读取双精度浮点数
答案:C

每个SSE寄存器宽度为____位。
A:32
B:64
C:128
D:256
答案:C

我国首次获得戈登?贝尔奖是在____年。
A:2015
B:2016
C:2017
D:2018
答案:B

暂无优惠

已有 312 人学习

提供优质的教育资源

公众号: 超前自学网