跳转至

Linkpack 节点的选择程序优化

赛题描述

给定 2 个 SPINE 交换机下 48 个候选节点,要求在不超过 3 次 Linpack 计算的情况下,通过程序或脚本以全自动的方式选择 16 个节点,得到 16 节点的 Linpack 最优值。

linpack 的评测指标是 gflops。

输入

无,选手可自行获取相关信息

输出

结果输出到output.txt,其中包含 16 个节点名(可通过hostname -s 获取)。与最优值误差在 0.1%之内的结果都算正确。

提交方式

选手提交一个压缩包,我们运行其中 run.sh,选手程序输出结果,我们进行核验。选手程序中 NB 值等可在 run.sh 指定,最后输出 gflops 值。

测试环境

我们提供了一个样例集群共选手实验提交之用,请注意,该集群及网络拓扑与最终测试的集群并不一致,选手程序需要有通用性,请勿针对该集群进行设计。

选手可以向linpack 分区提交任务以测试。请注意,单次申请节点数不得超过 4 个,单次申请时间不得超过 30 分钟,否则将失去该节点申请资格。建议选手在 compute 节点进行编码,向 linpack 提交任务进行测试。

申请节点时请加上--exclusive 选项,以免受其他评测影响。

提示

1. 使用 Intel OneAPI MKL 函数库下的 mp_linpack 软件测试包用于 Linpack 测试(安装在/data/software/intel/mkl/)。我们的集群中,只有SCOW 集群安装了该脚本,请 2. 建议编写 dgemm 测试程序用于筛选 Linpack 测试的 NB 值,以及筛选候选节点的双精度性能 3. 建议采用 MPI pingpong 测试的方式分析出候选节点的网络拓扑