8 月 22-24 日, 2025 中國算力大會在山西大同成功舉辦。中國算力大會是由工業(yè)和信息化部主辦的中國規(guī)格最高的算力大會,2025 年本屆大會由山西省人民政府、山西省工業(yè)和信息化廳承辦,以“算網(wǎng)筑基 智引未來”為主題,齊聚基礎(chǔ)電信企業(yè)、芯片企業(yè)、算力企業(yè)、科研機構(gòu)、高等院校等單位代表及行業(yè)專家。本屆大會聚焦算力基礎(chǔ)設(shè)施構(gòu)建、智算融合發(fā)展與綠色低碳創(chuàng)新,全方位展示我國算力產(chǎn)業(yè)最新成果。
中昊芯英作為國內(nèi) TPU 架構(gòu) AI 算力的核心推動者,深度參與本屆大會。聯(lián)合創(chuàng)始人及 CTO 鄭瀚尋在開幕式主論壇發(fā)表《攻堅 AI 軟硬件協(xié)同效能:國產(chǎn)自研TPU芯片軟件棧的優(yōu)化實踐與生態(tài)構(gòu)建》主題演講;中昊芯英展區(qū)以“算力硬件—云服務(wù)—解決方案”三維場景全面展示 TPU AI 基座,并憑借全自研的 TPU 架構(gòu) AI 專用算力芯片“剎那®”獲評“創(chuàng)新先鋒案例”;同期,中昊芯英首席架構(gòu)師平曉峰在大會重榜活動“星耀之夜”發(fā)表《基于 GPTPU 架構(gòu)的國產(chǎn)高性能智算平臺》主題分享,中昊芯英解決方案架構(gòu)師顧立程在智能計算創(chuàng)新發(fā)展論壇中發(fā)表《TPU AI 專用算力芯片:大模型基礎(chǔ)設(shè)施的突破之路》主題演講。
開幕式主論壇:聯(lián)合創(chuàng)始人及 CTO 鄭瀚尋闡釋軟硬件協(xié)同創(chuàng)新,定義國產(chǎn)算力新路徑
中昊芯英聯(lián)合創(chuàng)始人及 CTO 鄭瀚尋受邀在大會的開幕式主論壇發(fā)表《攻堅 AI 軟硬件協(xié)同效能:國產(chǎn)自研 TPU 芯片軟件棧的優(yōu)化實踐與生態(tài)構(gòu)建》主題演講。面對當(dāng)前 AI 算力規(guī)模快速擴張與系統(tǒng)效能瓶頸之間的突出矛盾,他指出軟硬件協(xié)同設(shè)計作為突破算力性能約束的關(guān)鍵路徑,并深度闡釋國產(chǎn) GPTPU 架構(gòu) AI 芯片全棧軟件生態(tài)的協(xié)同創(chuàng)新模式。
鄭瀚尋以中昊芯英自研的 GPTPU 架構(gòu) AI 專用算力芯片“剎那®”為核心,詳細(xì)解析了針對先進大模型全生命周期性能優(yōu)化的關(guān)鍵技術(shù)路徑,通過算子優(yōu)化、KV融合與訪存優(yōu)化、計算圖拓?fù)渲貥?gòu)與系統(tǒng)級優(yōu)化(io_uring)等軟硬件協(xié)同設(shè)計關(guān)鍵技術(shù),實現(xiàn) Attention 層耗時降低、 token 延遲減少、讀寫效率提升、系統(tǒng)通信性能優(yōu)化等系統(tǒng)級優(yōu)化,顯著提升大模型訓(xùn)練與推理任務(wù)的執(zhí)行效率。這些軟件棧的系統(tǒng)級創(chuàng)新成果在 DeepSeek 等國產(chǎn)主流大模型的適配中得到充分驗證,并成為全國首批通過由中國信通院、人工智能軟硬件測試驗證中心、中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟聯(lián)合權(quán)威發(fā)布的“DeepSeek 大模型適配通過名單”的 8 家企業(yè)之一,展現(xiàn)了中昊芯英從技術(shù)追趕到產(chǎn)業(yè)引領(lǐng)的戰(zhàn)略轉(zhuǎn)型決心。
獲評 2025 中國算力大會“創(chuàng)新先鋒案例”,TPU 架構(gòu) AI 專用算力芯片獲權(quán)威認(rèn)可
在大會創(chuàng)新成果發(fā)布與頒獎環(huán)節(jié),中昊芯英憑借全自研的 TPU 架構(gòu) AI 專用算力芯片“剎那®”獲評“創(chuàng)新先鋒案例”,該芯片擁有完全自主可控的 IP 核、全自研指令集與計算平臺,AI 算力性能超越海外著名 GPU 產(chǎn)品近 1.5 倍,能耗降低 30%,單位計算成本降低近 50%。同時,采用 Chiplet 技術(shù)與 2.5D 封裝,實現(xiàn)同等制程工藝下的性能躍升。支持 1024 片芯片高速片間互聯(lián),系統(tǒng)級性能比傳統(tǒng) GPU 集群提升數(shù)倍,為構(gòu)建千卡、萬卡規(guī)模超算集群奠定基礎(chǔ)。基于“剎那®”芯片構(gòu)建的“泰則®”GPTPU 人工智能服務(wù)器與計算集群系統(tǒng),單集群最大浮點運算能力在 TF32 計算精度及稀疏算力技術(shù)下可達(dá) 400P 以上,有力支撐包括超千億參數(shù) AIGC 大模型運算、高級無人駕駛模型訓(xùn)練、蛋白質(zhì)結(jié)構(gòu)精密預(yù)測等各類高強度 AI 運算場景。該方案在算力性能、能效比、兼容性等方面表現(xiàn)突出,目前已應(yīng)用于多個大型智算中心,支持大模型訓(xùn)練、推理及行業(yè) AI 應(yīng)用落地。
中昊芯英在核心展區(qū)打造 69 平方米特裝展位,以“算力硬件—云服務(wù)—解決方案”三維場景全面展示 TPU AI 基座。現(xiàn)場重點展出全自研 TPU 架構(gòu) AI 芯片“剎那®”及人工智能服務(wù)器“泰則®”,并部署多臺服務(wù)器設(shè)置交互體驗環(huán)節(jié),實機運行 DeepSeek 等國產(chǎn)大模型,吸引大量專業(yè)觀眾駐足交流。
分論壇及專題活動分享,多維展現(xiàn)國產(chǎn) TPU 的架構(gòu)創(chuàng)新、集群實踐與生態(tài)共建
在大會同期重磅活動“算力中國·星耀之夜”,中昊芯英首席架構(gòu)師平曉峰發(fā)表《基于 GPTPU 架構(gòu)的國產(chǎn)高性能智算平臺》主題分享。該活動由工業(yè)和信息化部新聞宣傳中心副主任趙榮貴、山西省工業(yè)和信息化廳副廳長劉勇、大同市委常委兼大同經(jīng)開區(qū)黨工委書記寧文鑫等重要領(lǐng)導(dǎo)出席并致辭。平曉峰在演講中系統(tǒng)闡述了公司從自主芯片研發(fā)到全棧服務(wù)布局的技術(shù)體系,重點介紹了基于 GPTPU 架構(gòu)的高性能智算平臺建設(shè)成果與產(chǎn)業(yè)實踐。并結(jié)合與深圳聯(lián)通、天津移動等伙伴共建智算中心的落地案例,以及在金融、法律、創(chuàng)新創(chuàng)業(yè)等多領(lǐng)域的 AI 垂直大模型融合應(yīng)用,呈現(xiàn)中昊芯英以全棧自主、生態(tài)兼容的 GPTPU 架構(gòu)云平臺推動國產(chǎn)算力底座建設(shè)與行業(yè)智能化轉(zhuǎn)型的核心價值與實施路徑。
在智能計算創(chuàng)新發(fā)展論壇中,中昊芯英解決方案架構(gòu)師顧立程發(fā)表《TPU AI 專用算力芯片:大模型基礎(chǔ)設(shè)施的突破之路》主題演講。回顧 GPU 架構(gòu)變化歷史,發(fā)現(xiàn) Tensor Core 的架構(gòu)革新對 GPU 算力性能提升顯著,而 TPU 本質(zhì)上是獨立出來的 Tensor core,為 AI 大模型訓(xùn)練而生。中昊芯英 TPU 架構(gòu) AI 芯片在大規(guī)模計算單元調(diào)度、能效優(yōu)化及千卡集群構(gòu)建方面的核心技術(shù)突破,“泰則®”智算系統(tǒng)與千卡級集群能力,全面展示了中昊芯英在算力效能、能效比和軟硬件協(xié)同方面的顯著優(yōu)勢,為傳統(tǒng)行業(yè)智能化轉(zhuǎn)型提供可復(fù)用的算力支撐。
本屆大會見證了我國算力產(chǎn)業(yè)的蓬勃生機。中昊芯英憑借在自研 TPU 架構(gòu)、千卡集群與全棧軟件生態(tài)上的系統(tǒng)性突破,充分展現(xiàn)了國產(chǎn)算力支撐大模型創(chuàng)新與行業(yè)智能化轉(zhuǎn)型的實力與決心。未來,公司將繼續(xù)深化軟硬件協(xié)同創(chuàng)新,攜手產(chǎn)業(yè)伙伴共促智算融合與自主創(chuàng)新,為構(gòu)建自主可控、高效綠色的智能算力基石持續(xù)貢獻(xiàn)力量。