香港商報
-- 天氣
新成果!深圳高校師生開發基於GPU並行的一種快速近場動力學算法

新成果!深圳高校師生開發基於GPU並行的一種快速近場動力學算法

責任編輯:鄭嬋娟 2025-01-31 16:53:46原創 來源:香港商報網

近日,一種基於GPU並行的快速近場動力學算法,實現了計算力學算法與計算機技術的深入交叉結合,為解決傳統計算力學算法的效率問題找到了新的方向。

與現有基於串行程序和共享內存並行編程 (OpenMP)並行的近場動力學算法程序相比,該算法分別可實現高達800倍和100倍的加速。在典型的百萬級粒子模擬中,執行4000次迭代在單精度下可在5分鐘內完成,在雙精度下可在20分鐘內完成,這在低端GPU PC上即可實現。

這項技術的廣泛應用將有助於推動多個領域的創新,特別是在需要高性能計算支持的行業中。通過利用消費級GPU的強大計算能力,研究人員能夠更高效地解決複雜的物理問題,從而推動科技進步和產業升級。

該成果發表在《計算力學學報》和《Engineering Analysis with Boundary Elements》。作者為深圳北理莫斯科大學楊楊副教授,與南方科技大學劉軼軍講席教授、碩士研究生蘇梓鑫。深圳北理莫斯科大學為第一完成單位。

在低端GPU PC上即可實現

近場動力學(Peridynamics)是一種有效解決斷裂問題的方法。由於近場動力學的非局部特性,每個材料點僅與其鄰域內的點相互作用,這使得其非常適合進行並行化處理。目前,基於GPU的近場動力學並行研究,大多集中在將串行程序轉換為並行程序。許多優化策略帶來的加速效果主要依賴於GPU自身性能的提升,而針對GPU硬件結構的優化相對較少。此外,GPU並行計算仍存在一些問題:用於存儲鄰域點的內存空間沒有預設大小,導致線程和內存資源的低效使用,造成內存和計算資源的浪費,使得GPU在處理大規模問題時面臨挑戰;大多數GPU並行計算仍然嚴重依賴全局內存,未能充分利用英偉達的統一計算設備架構(NVIDIA's Compute Unified Device Architecture, CUDA) 的內存結構,導致內存帶寬的浪費;大多數近場動力學並行算法缺乏通用性,一些算法可能限制了鄰域的大小,僅能處理均勻分布且未受損的離散結構,或者限制了近場動力學理論的應用。

基於上述限制,本研究設計了一個成本效益高且性能優異的近場動力學模擬框架。該分析框架能夠以高效的計算速率準確模擬鍵基和態基近場動力學問題。該算法採用了粒子並行模式,建立了一個通用的鄰域生成模塊用以優化存儲,並提出了一種通用寄存器技術,用於高速訪問寄存器內存,減少全局內存訪問。該技術不僅消除了對鄰域點數量的限制,還適用於材料點的非均勻分布。

與現有基於串行程序和OpenMP並行的近場動力學算法程序相比,該算法分別可實現高達800倍和100倍的加速。在典型的百萬級粒子模擬中,執行4000次迭代在單精度下可在5分鐘內完成,在雙精度下可在20分鐘內完成,這在低端GPU PC上即可實現。這意味着,在處理複雜的材料設計和損傷模擬時,研究人員能夠更快地獲得結果,從而加速科學研究和工程應用的發展。

楊楊博士於2023年9月加入深圳北理莫斯科大學材料科學系,主要研究方向為:計算固體力學、邊界元、近場動力學、機器學習等高性能算法開發,結構振動、斷裂、疲勞分析。(記者 林麗青)

頂圖:通用寄存器優化算法示意圖

責任編輯:鄭嬋娟 新成果!深圳高校師生開發基於GPU並行的一種快速近場動力學算法
香港商報PDF
股市

友情鏈接

承印人、出版人:香港商報有限公司 地址:香港九龍觀塘道332號香港商報大廈 香港商報有限公司版權所有,未經授權,不得複製或轉載。 Copyright © All Rights Reserved
聯絡我們

電話:(香港)852-2564 0768

(深圳)86-755-83518792 83518734 83518291

地址:香港九龍觀塘道332號香港商報大廈