摘要:“神威·太湖之光”是我國全自主研發的千萬核超級計算機,目前已有很多大型應用程序在此先進架構上進行了移植優化。然而,高能物理領域的格點量子色動力學(LQCD)數值模擬軟件在神威平臺上尚未進行過移植優化,這引起了科學工作者們的關注。針對LQCD在神威平臺上的移植優化問題展開研究。首先,論述了國內外對LQCD在不同硬件架構上進行并行優化的發展歷程。其次,通過對其熱點模塊Dslash的重構,實現了在神威平臺上的成功移植。再次,針對申威26010芯片異構眾核的架構和并行模式,實現了從核陣列異構并行、從核本地設備存儲器(LDM)與主存之間的直接存儲訪問(DMA)通訊、主核之間的消息傳遞接口(MPI)通訊及全局歸約等操作。最后,經過實驗測試,單核組優化程序與16核組優化程序相比單主核程序分別獲得了165倍和25倍的加速比,并發現了一些重要的性能瓶頸問題,為進一步優化提升整體效率奠定重要基礎。同時,對國產超算平臺的推廣使用具有積極意義。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社