近日,智源研究院發(fā)布AI芯片生態(tài)實驗室和九鼎智算平臺。九鼎平臺旨在打造AI科研創(chuàng)新的基石與試驗場,目標(biāo)向上支撐未來十年的計算新范式,包括通用智能基礎(chǔ)大模型、AI for Science等;向下致力于為產(chǎn)學(xué)研加速融合、軟硬件協(xié)同創(chuàng)新、國產(chǎn)AI芯片生態(tài)建設(shè)提供強大基座。目前,九鼎平臺在建1000P算力,每服務(wù)器400Gbps高速互連能力的高性能環(huán)境。
與傳統(tǒng)商業(yè)云計算專注于“推理”任務(wù)不同,九鼎平臺發(fā)力探索滿足大規(guī)模混合計算任務(wù)的調(diào)度方法,追求在科研“訓(xùn)練”任務(wù)上表現(xiàn)更加優(yōu)秀。此外,作為混合架構(gòu)云平臺,九鼎將支撐多家廠商AI加速芯片,希望通過探索自動適配的新方法,讓每一款異構(gòu)計算芯片發(fā)揮其最佳運算能力,以提升整體平臺效能,降低AI異構(gòu)加速芯片的產(chǎn)業(yè)化難度。
此外,智源大模型團隊積極開展國際技術(shù)交流合作,目前正在攜手埃及阿拉伯科技與海運學(xué)院、埃及亞歷山大圖書館,共建世界最大阿拉伯語數(shù)據(jù)集,共同開展阿拉伯大模型研制和應(yīng)用開發(fā)。
融合人工智能(AI)與高性能計算(HPC)是探索新一代計算系統(tǒng)體系結(jié)構(gòu)的重要趨勢。傳統(tǒng)科學(xué)計算以結(jié)構(gòu)化數(shù)據(jù)為主,高性能低延遲,雙精度數(shù)值計算,而AI智能計算系統(tǒng)以非結(jié)構(gòu)化為主,高并發(fā)高吞吐率、低精度張量計算,高帶寬訪存。隨著人工智能技術(shù)前沿、多學(xué)科交叉應(yīng)用與產(chǎn)業(yè)化落地的發(fā)展,兩種計算范式逐漸走向融合與共存,其中通用大模型、AI for Science 最典型的科研領(lǐng)域。
智源研究院總工程師林詠華在接受記者采訪時表示,目前九鼎平臺在建構(gòu)之余,將探索三大技術(shù)問題——
第一,滿足大規(guī);旌嫌嬎闳蝿(wù)的調(diào)度方法。以產(chǎn)業(yè)界為例,商業(yè)云廠商的AI任務(wù)多以并發(fā)量高的推理任務(wù)為主,與九鼎平臺的AI大模型訓(xùn)練任務(wù)差異性很大。在多個大模型同時訓(xùn)練的情況下,如何支持?jǐn)?shù)據(jù)層級、算子層級、任務(wù)層級等不同并行優(yōu)化策略,同時平衡好網(wǎng)絡(luò)和計算是調(diào)度需要解決的核心問題。
第二,AI+HPC融合的云計算體系結(jié)構(gòu)。在AI for Science領(lǐng)域,深度學(xué)習(xí)計算與傳統(tǒng)高性能計算兩種范式如何高效共存是需要解決的重要問題。由于AI和HPC需要的計算需求有明顯差異,在現(xiàn)有的通用處理器和AI加速器的異構(gòu)計算云平臺資源上,構(gòu)造一套能混合、彈性調(diào)度AI和HPC workload的云計算能力,對AI科研云平臺的發(fā)展至關(guān)重要。
[if !supportLists]第三,實現(xiàn)拉動異構(gòu)計算體能力的統(tǒng)一適配層。為不同廠商的多樣化AI加速芯片,探索一種能自動學(xué)習(xí)、自動匹配最佳運行硬件架構(gòu)環(huán)境的適配層,即用AI學(xué)習(xí)能力來自動優(yōu)化AI系統(tǒng)的運行環(huán)境,讓每一款異構(gòu)計算芯片都能達(dá)發(fā)揮其最佳的運算能力,整體提升異構(gòu)云平臺的效能,幫助產(chǎn)業(yè)大大降低優(yōu)化的門檻。
對此,林詠華指出,這三個重要的技術(shù)方向關(guān)乎未來AI計算的體系結(jié)構(gòu)、系統(tǒng)平臺的發(fā)展,十分需要與技術(shù)企業(yè)、科研團體開放合作。“比如,我們在進(jìn)行這些探索研究中,很重要的一類合作伙伴就是AI芯片企業(yè)!
她進(jìn)一步解釋稱,智源研究院尋求的是通過AI生態(tài)合作,來推動AI基礎(chǔ)研究成果的落地。作為科研機構(gòu),智源研究院強調(diào)的不是護城河,而是開放合作!耙驗锳I領(lǐng)域十分寬廣和縱深。它涉及十分寬廣的不同產(chǎn)業(yè)應(yīng)用領(lǐng)域(如計算機視覺、NLP等領(lǐng)域,又或AI用到金融、工業(yè)、自動駕駛等不同應(yīng)用領(lǐng)域),每個應(yīng)用領(lǐng)域都十分專業(yè)。而在每一個垂直的應(yīng)用領(lǐng)域又十分縱深,涉及從底層的加速芯片、硬件系統(tǒng)到上面的AI算法、AI應(yīng)用、AI安全等等。所以,人工智能的發(fā)展需要許多團隊和人才不斷前赴后繼、把技術(shù)推陳出新。因此,我們不想構(gòu)筑自己的護城河,反而希望搭建可以共同開放創(chuàng)新的平臺,一旦有新的技術(shù)和新的積累,都希望以開源開放的方式共享給整個產(chǎn)業(yè),從而和整個產(chǎn)業(yè)一起推動AI的創(chuàng)新。”
據(jù)了解,基于九鼎平臺大規(guī)?蒲杏嬎銓嵺`環(huán)境,智源研究院也于近日宣布聯(lián)合多家國內(nèi)AI芯片公司,北京大學(xué)羅國杰團隊、北京大學(xué)董豪團隊、清華大學(xué)翟季冬團隊、中科院計算所崔慧敏團隊等相關(guān)科研團隊,共建AI芯片生態(tài)實驗室,旨在加速國內(nèi)AI芯片的生態(tài)發(fā)展和應(yīng)用落地。通過搭建AI芯片的產(chǎn)學(xué)研平臺,推動測試、標(biāo)準(zhǔn)、創(chuàng)新、應(yīng)用等方面合作,從而加速國內(nèi)AI芯片滿足大規(guī)模應(yīng)用部署的條件,通過軟硬件協(xié)同創(chuàng)新實現(xiàn)在性能上的突破,并為未來通用智能大模型、AI for Science等新的計算范式做好準(zhǔn)備。
林詠華告訴記者,摩爾定律已接近瓶頸,通用大模型、AIfor Science等前沿技術(shù)探索正驅(qū)動著新一代計算的體系結(jié)構(gòu)變革。AI芯片生態(tài)實驗室將有助于拉動國產(chǎn)AI芯片對相關(guān)重大科研計算范式的優(yōu)化,加速完善芯片軟件生態(tài)建設(shè)。
“這不是一個簡單的聯(lián)盟,是圍繞AI芯片來打造生態(tài)的實驗室,強調(diào)的是軟硬件協(xié)同創(chuàng)新!彼赋觯珹I芯片要成功,必須要構(gòu)建足夠強大的上層生態(tài)軟件,尤其是通過生態(tài)軟件的開源開放,形成各種開放接口的標(biāo)準(zhǔn)體系。“這也是為什么我們實驗室名字有‘生態(tài)’這兩個字,需要各方把研發(fā)的能力聚集在一起,扎實進(jìn)行有利于生態(tài)建設(shè)的開發(fā)和創(chuàng)新!
“單純依靠摩爾定律下的工藝發(fā)展所帶來的芯片性能已接近極限,加上許多最先進(jìn)的工藝技術(shù)國內(nèi)難以使用,通過芯片架構(gòu)創(chuàng)新獲得下一代芯片性能提升變得至關(guān)重要。在過去幾十年,CPU發(fā)展進(jìn)程已經(jīng)充分證明基礎(chǔ)系統(tǒng)軟件對芯片架構(gòu)的重要性,架構(gòu)創(chuàng)新離不開系統(tǒng)軟件的配合,并且需要通過系統(tǒng)軟件(如編譯器等)來實現(xiàn)自動利用、自動優(yōu)化,才能讓上層應(yīng)用獲益。在國內(nèi),AI芯片的研發(fā)力量集中在芯片公司,而基礎(chǔ)軟件的創(chuàng)新主要在高校團隊。因此,要拉動國產(chǎn)AI芯片的軟硬件協(xié)同創(chuàng)新,需要鼓勵和加大跨層的創(chuàng)新和合作!彼a充道。
最新評論