新闻 图说CPC赛事通知新网直通车 新网会客厅

决赛赛题发布:第二届国产CPU并行应用挑战赛决赛赛题发布

浏览次数:1120 发布时间:2018-09-03-07:09:00

基于国产CPUGromacs优化

1、简介

Gromacs是一个可配置的分子动力学模拟工具,最初为了模拟蛋白质,脂类和氨基酸等有复杂化学键的生物分子,由于Gromacs提供了极好的非键作用力模拟性能,很多研究组织也开始使用Gromacs模拟聚合物等非生物分子体系。

Gromacs现在支持几乎所有常见的分子动力学模拟算法,并且具有高性能,易于使用,开源,辅助工具丰富的特点,使其成为了当代分子动力学软件的佼佼者之一。

2、源码下载

链接: https://pan.baidu.com/s/1oPfNeg14rVpbzXd4HIfPRg 

密码: q7sc

3、算例简介

离子通道算例ION_CHANNEL-ST.TPR:限定 16个进程 4个国产节点)运行 。

木质纤维算例LIGNOCELLULOSE-RF.BGQ-ST.TPR:限定64个进程(16个国产节点)运行 。

木质纤维算例LIGNOCELLULOSE-RF.BGQ-ST.TPR:限定512个进程(128个节点)运行 。


Gromacs快速指南

1、压缩包中的文件说明

① gmx_mpi_d:Intel平台上的GROMACS二进制文件,可以用于查看运行结果。

②gromacs-5.1.5.tar.gz: gromacs-5.1.5的源代码。

③.ion_channel-st.tpr: 离子通道算例的输入文件。

④lignocellulose-rf.BGQ-st.tpr: 木质纤维算例的输入文件。

gcc_spinlock.h: 为神威平台修改过的gcc_spinlock实现。

2、编译

①使用压缩包中的gcc_spinlock.h替换gromacs中的src/external/thread_mpi/include/thread_mpi/atomic/gcc_spinlock.h

②   cd gromacs-5.1.5

③mkdir build

④cd build

LD=mpiCC CC=mpicc CXX=mpiCC cmake .. -DGMX_FFT_LIBRARY=fftpack -DGMX_MPI=on -DGMX_DOUBLE=ON -DGMX_BUILD_MDRUN_ONLY=ON -DBUILD_SHARED_LIBS=off –LH

⑥在build文件夹中执行make可以进行增量编译。

3、运行

bsub <必要的参数> bin/mdrun_mpi_d -s <算例文件> -v

4、优化

推荐通过增加LDFLAGS链接外部库的方式完成从核代码的加入。

5、验证

查看输出的能量文件:gmx_mpi_d dump -e ener.edr

比对输出的能量文件:gmx_mpi_d check -e ener.edr -e2 another_ener.edr

6、Gromacs验证方法与程序

程序正确性验证的方法和程序会在之后公布出来,并会以公告和邮件的方式通知进入决赛的各参赛队。

7、决赛英雄榜

为了提升各参赛队比赛的积极性,后期我们会开放英雄榜榜单以供进入决赛的参赛队打榜。

具体的打榜规则会以公告和邮件的方式通知进入决赛的各决赛参赛队。

8、注意事项

①不得修改以及变相修改输入文件;

②运行结果应与原程序大致一致,校验标准将于后期发布;

③不得修改程序内计时方法以及标准输出信息;

④GROMACS程序的优化需符合分子动力学的实际意义;

⑤不得针对于验证程序做优化;

⑥建议参赛队采取任何激进的优化方法前与组委会沟通交流。

9、评分规则

参赛队决赛评分组成:

①离子通道算例 16进程 (4个国产节点) 众核优化分值 SCORE_ONE = 30分;

②木质纤维算例 64个进程(16个国产节点)众核优化分值SCORE_TWO= 40分;

③木质纤维算例 512进程 (128个国产节点)众核优化分值SCORE_THREE = 20 分;

④PPT+答辩:应详细地列出所使用的优化技术,并做简洁明了的介绍。现场答辩分值 SCORE_FOUR = 10分 。

总分数的计算公式:

SCORE_OPT = 30*sqrt(Tmin_one/Tteam_one) + 40*sqrt(Tmin_two/Tteam_two) + 20*sqrt(Tmin_three/Tteam_three)

SCORE = SCORE_OPT + SCORE_PPT

说明: 

Tmin_one , Tmin_two ,Tmin_three 是每个优化任务参赛队的最小运行时间;
Tteam_one , Tteam_two , Tteam_three 
是每个优化任务当前参赛队的运行时间;
SCORE_PPT
是各参赛队现场答辩的分数,理论上SCORE_PPT不大于10分。

10、硬件环境

队列: 神威太湖之光Q_SW_CPC

参赛队资源: 每个参赛队可用节点数不超过128个节点


版权所有 国产CPU并行应用挑战赛