動態編程算法應用于醫療健康、機器人、量子計算、數據科學等多個領域。
3 月 23 日在 GTC 上發布的 NVIDIA Hopper GPU 架構利用全新 DPX 指令,將動態編程速度提高多達 40 倍。動態編程是一種應用于基因組學、量子計算、路線優化等領域算法中,用以解決問題的技術。
DPX 是 NVIDIA H100 GPU 的內置指令集,可幫助開發者編寫代碼,用以提高多個行業中動態編程算法的速度,從而加速疾病診斷、量子模擬、圖形分析和路線優化的工作流程。
何為動態編程?
動態編程是一種起源于 20 世紀 50 年代的熱門技術,它通過遞歸和記憶化這兩種關鍵技術來解決復雜問題。
遞歸是指將問題分解為較簡單的子問題,達到節省時間和計算量的目的。而記憶化則負責存儲這些子問題的答案,這些答案在解決主問題時會被重復使用多次。記憶化可提高效率,因此在主問題稍后需要這些答案時無需重新計算子問題。
與 NVIDIA Ampere 架構 GPU 相比,DPX 指令在 NVIDIA H100 GPU 上將動態編程算法的速度提升了 7 倍之多。在搭載四塊 NVIDIA H100 GPU 的節點中,速度還可以進一步提升。
用例涵蓋醫療健康、機器人、量子計算、數據科學
動態編程通常用于許多優化、數據處理和組學算法中。迄今為止,大部分開發者都已在 CPU 或 FPGA 上運行了此類算法,而 NVIDIA Hopper GPU 上,借助 DPX 指令,可實現大幅加速。
組學
組學涵蓋一系列生物領域,包括基因組學(側重于 DNA)、蛋白質組學(側重于蛋白質)和轉錄組學(側重于 RNA)。這些領域為疾病研究和藥物研發等依賴于算法分析(可通過 DPX 指令加速)的關鍵工作提供了依據。
例如,Smith-Waterman 和 Needleman-Wunsch 動態編程算法用于 DNA 序列比對、蛋白質分類和蛋白質折疊之中。這兩種算法均使用評分的方法來測量不同樣本基因序列的比對情況。
Smith-Waterman 可生成高度準確的結果,但與其他比對方法相比,需消耗更多計算資源和時間。在搭載四塊 NVIDIA H100 GPU 的節點上使用 DPX 指令時,科學家可將此進程加快 35 倍,實現實時處理。其中,堿基識別和比對工作的速度與 DNA 測序相同。
這種加速將有助于全球各地的醫院普及基因組分析,讓科學家朝著為患者提供個性化醫療的方向邁進。
線路優化
無論是行走于倉庫這樣動態化環境中的自主機器人,還是需要將數據傳輸到計算機網絡中多個接收端的發送者,都需要為多個移動部件找到最優線路,這一點至關重要。
為了解決這一優化問題,開發者使用 Floyd-Warshall 動態編程算法來尋找地圖或圖形中所有成對目的地之間的最短距離。在搭載四塊 NVIDIA H100 GPU 的服務器中,與傳統的雙插槽 CPU 服務器相比,Floyd-Warshall 將速度提升了 40 倍之多。
結合 NVIDIA cuOpt AI 物流軟件,這種線路優化加速可用于工廠、自動駕駛汽車中的實時應用或抽象圖形中的地圖構建和線路算法。
量子模擬
借助 DPX 指令,其他大量動態編程算法均可在 NVIDIA H100 GPU 上實現加速。量子計算領域前景廣闊。在量子計算中,量子模擬的張量優化算法會使用動態編程。DPX 指令可以幫助開發者加快識別正確張量縮并順序的過程。
SQL 查詢優化
另一個潛在應用領域是數據科學。使用 SQL 編程語言的數據科學家通常需要在一組表上執行多次“合并”運算。動態編程有助于找到這些合并的最佳順序,這通常可以節省大量執行時間,從而加快 SQL 查詢速度。