沿出城公路行駛20余公里,在植被覆蓋的山腳下,一處灰白色的現(xiàn)代建筑藏身于此。這是西部某城于2022年開工建設的智算中心。
這座西部小城夏季平均氣溫僅有23攝氏度,涼爽的氣候、較低的土地價格,以及豐富的清潔能源,吸引了大量算力企業(yè)來此投資。
不愿具名的業(yè)內知情人士告訴記者,這座千卡規(guī)模的智算中心,上架率不足50%。即便已上架的服務器,實際利用率不足30%,而年運營成本則超過3000萬元。
在全國,這樣的智算中心不是個例。
截至2024年11月,全國已投運的智算中心項目近150個,在建和規(guī)劃建設的智算中心項目近400個。據(jù)浪潮人工智能研究院測算,我國智算中心平均算力使用率僅為30%。
人工智能技術的飛速發(fā)展,催生智能算力建設熱潮。但在這股熱潮下,不少盲目上馬的智算中心正在空轉,大量閑置算力等待激活。
高質量需求遭遇低質量擴張
算力是計算機處理數(shù)據(jù)能力的統(tǒng)稱。如果把大模型等人工智能產品看作一輛高速行駛的汽車,數(shù)據(jù)是汽油燃料,算力則是發(fā)動機。根據(jù)運算精度、效率等指標的不同,算力大致可分為通用算力、智能算力、超算算力等。其中,平衡精度與效率、能夠執(zhí)行復雜機器學習算法的智能算力,是當下市場搶手資源。
工信部數(shù)據(jù)顯示,截至2024年底,我國算力總規(guī)模達280EFLOPS(EFLOPS表示每秒百億億次浮點運算),其中智能算力規(guī)模達90EFLOPS,占比32%。
賽迪顧問曾發(fā)布報告估計,2023年,中國智能算力需求達到123.6EFLOPS,但供給僅為57.9EFLOPS,有超過50%的智算需求未得到滿足。隨著大模型等人工智能技術的發(fā)展,這一缺口不斷擴大。
智算需求高漲的同時,部分已經建設完成的智算資源卻長期處于閑置狀態(tài)。
上述知情人士告訴記者,目前對于各地智算中心的閑置率沒有準確統(tǒng)計數(shù)字,但據(jù)他估算,部分三四線城市中小規(guī)模的智算中心,整體利用率不足三成。
脫離實際需求的盲目建設是導致部分算力閑置的重要原因。人工智能技術快速發(fā)展初期,部分地區(qū)為了培育和支撐當?shù)財?shù)字經濟產業(yè),通常鼓勵建設算力中心等數(shù)字基礎設施,并予以現(xiàn)金補貼等優(yōu)惠政策。
例如,2023年云南昆明出臺10條措施加快人工智能產業(yè)發(fā)展,提出支持智算中心、算力大模型服務平臺等建設,按平臺軟件和硬件設備實際投資的15%給予補貼,最高不超過5000萬元。
同年,安徽省也出臺政策支持各類市場主體建設智算中心,對規(guī)模400P(1P為每秒計算1000萬億次)以上單體智能算力建設項目,省市按1∶2比例對建設和運營經費予以補貼。
軟通動力首席人工智能官金亞東認為,在人工智能產業(yè)發(fā)展初期,算力資源緊缺,建設投入成本大,對算力供給方予以補貼等支持政策符合產業(yè)初期發(fā)展需求。
但補貼吸引來的并非都是理性投資者。金亞東表示,許多快速上馬建設的智算中心通常由分散的社會資本和城市資本建設?!斑@些資本的特點是資金充足,但不懂行業(yè),很難找到合適的需求方。”他說。
追逐短期利益的“外行”投資者缺乏對人工智能技術發(fā)展趨勢的深入分析,以及配套相關產業(yè)規(guī)劃,這使得部分智算中心建設時只追求單一指標,導致“建成即落后”,難以滿足市場上日漸復雜的智算需求,低質量算力供給出現(xiàn)過剩。
上述知情人士舉例說,高性能智算中心服務器通常采用CPU(中央處理器)、GPU(圖形處理器)、NPU(神經網絡處理器)等相互混搭的異構計算架構,以充分發(fā)揮不同算力芯片在性能、成本和能耗上的優(yōu)勢。“但有些所謂的智算中心大量配置同一類芯片,花了不少錢,其實應用場景很窄?!彼f。
不僅是芯片,為了充分發(fā)揮服務器性能以及保障穩(wěn)定運行,高性能的智算中心還要在存儲、散熱等方面進行強化設計。中國科學院計算技術研究所研究員張云泉此前在調研中發(fā)現(xiàn),部分智算中心的機架功率密度不足15千瓦,遠低于高性能人工智能訓練所需的至少40千瓦的功率密度要求?!罢嬲苤未竽P陀柧毜母叨怂懔χ行暮苌?,且訓練效率不超過30%?!睆堅迫f。
為閑置的算力找合適的需求
當下,圍繞人工智能大模型產生的訓練需求,毫無疑問是智算市場中的主力需求。但隨著以DeepSeek R1為代表的推理模型的火熱,智算需求也在不斷發(fā)生變化。
如果把訓練階段的大模型看作學齡前兒童,其需要家長投入大量精力教會它們基本技能。而進入到推理階段的大模型,則可以算是具備生活自理、自主學習能力的青少年,不再需要家長投入大量精力,也就是算力進行高強度教育。
訓練和推理階段對算力需求的差別主要體現(xiàn)在精度和規(guī)模上。訓練階段,算力精度至少為16位浮點,才能基本保證計算準確性。但進入推理階段,16位浮點精度可謂游刃有余,即使是更低的精度也可以有效滿足需求。而在規(guī)模上,相比于訓練階段動輒千卡、萬卡規(guī)模的算力需求,推理階段所需的算力甚至可以被容納在一個與電腦機箱大小相當?shù)耐评硪惑w機中。
推理模型的特點給市場帶來了明顯變化,算力需求正在變得更加碎片化?!癉eepSeek爆火之前,智算中心主要瞄準大企業(yè)、大模型的訓練需求,現(xiàn)在很多小公司、AI創(chuàng)業(yè)者基于DeepSeek等模型的研發(fā),也對智算產生大量需求?!鄙鲜鲋槿耸扛嬖V記者,這些算力需求單獨來看并不大,對靈活性和成本敏感度要求更高,但積少成多后,總體需求仍十分可觀,有望激活部分閑置的算力資源。
“世界上沒有用不掉的算力,重點在于找到合適的應用。”金亞東認為,當下算力市場更重要的是做好“散對散”之間的配對,單體100P至1000P規(guī)模的算力供給方和大約5000萬家中小型企業(yè)或許才是未來市場的主角。
作為經濟發(fā)展的“毛細血管”,數(shù)量眾多的中小企業(yè)有著更明顯的長尾效應。他們廣泛參與到算力消納中,能夠讓整個產業(yè)生態(tài)更具活力,推動資源高效配置。
在浙江杭州臨平區(qū),當?shù)卦?021年率先提出發(fā)展算力產業(yè),建成全國首個算力小鎮(zhèn),聚集起算力產業(yè)鏈上下游企業(yè)1700余家。
2024年10月入駐算力小鎮(zhèn)的優(yōu)服工業(yè),是一家專注于數(shù)控機床后市場一站式服務的中小企業(yè)?;凇癆I+AR”技術,公司打造出數(shù)控領域的“超級工程師”,通過AR眼鏡實現(xiàn)了數(shù)控機床的智能報修和遠程運維管理。
“我們需要的算力規(guī)模,在國內數(shù)控機床維保行業(yè)里目前是最大的。但現(xiàn)在我們不用到處去找算力,小鎮(zhèn)平臺就可以直接提供,并且價格比市面上還要低,這對成本控制很有幫助?!眱?yōu)服工業(yè)運營經理葉飛說。
像優(yōu)服工業(yè)這樣需要算力的中小企業(yè),在小鎮(zhèn)里占了大約70%。面對它們的算力需求,算力小鎮(zhèn)打造出算力調度平臺和大模型服務平臺,整合阿里云、中國聯(lián)通等多方資源,解決項目資源分布不均、供需匹配不足等難點痛點問題,為其他地區(qū)借助算力服務廣大企業(yè),尤其是中小企業(yè)提供了可供參考的樣板。
推動算力資源高效配置
碎片化、分散化的算力需求,對于當下的算力市場既是機遇,也是挑戰(zhàn)。如何激活閑置算力資源,推動算力普惠,讓算力用得到、用得起、用得好?相關部門正在圍繞提升供給、激活需求兩方面發(fā)力。
中國信息通信研究院院長余曉暉認為,我國算力基礎設施建設已達到世界領先水平,但標準化、普惠化算力服務統(tǒng)一大市場尚未形成,需要在統(tǒng)籌全國算力設施區(qū)域優(yōu)化布局的基礎上,解決好算力服務統(tǒng)一市場構建和資源全域有效利用問題,促進算力資源高效配置。
圍繞建設統(tǒng)一的算力服務體系,我國多地開展積極探索,相繼發(fā)布了10余個算力調度平臺,一些企業(yè)也開展了算力并網探索。
例如,2023年初,寧夏率先上線了國內首個一體化算力交易調度平臺——東數(shù)西算一體化算力服務平臺,整合寧夏地區(qū)零散算力資源,解決算力輸出、應用、交易等難題。同年,中國信通院聯(lián)合中國電信共同發(fā)布全國一體化算力算網調度平臺,在國內首次實現(xiàn)跨資源池、跨架構、跨廠商的異構算力資源調度。
為提高公共算力資源使用效率,工業(yè)和信息化部日前印發(fā)《算力互聯(lián)互通行動計劃》,提出到2026年建立較為完備的算力互聯(lián)互通標準、標識和規(guī)則體系;到2028年基本實現(xiàn)全國公共算力標準化互聯(lián)。
中國信息通信研究院副院長魏亮建議,要推進跨主體、跨架構、跨地域的公共算力互聯(lián)互通,亟須構建統(tǒng)一的算力互聯(lián)互通標準體系,解決不同算力供給主體間協(xié)議與接口不統(tǒng)一的問題;統(tǒng)一算力資源感知、任務數(shù)據(jù)流動、應用架構適配等關鍵互聯(lián)規(guī)則和標準,形成算力互聯(lián)網和算力服務統(tǒng)一大市場。
為適應不斷更新的市場需求,不少地區(qū)也出臺了相應支持政策,鼓勵算力中心進行改造升級。《湖南省促進綠色智能計算產業(yè)高質量發(fā)展若干政策措施》中提出,推動傳統(tǒng)數(shù)據(jù)中心加快技術改造升級為智算中心,對新建(改造)總算力在50P以上,且數(shù)據(jù)中心電能利用效率不高于1.3的智算基礎設施項目,按照設備和軟件等建設費用10%的比例給予補助,最高不超過2000萬元。
在不斷提升算力供給質量和便利性的同時,為激發(fā)企業(yè)算力需求,“算力券”補貼作為最直接有效的方式也得到廣泛應用。
深度參與“東數(shù)西算”工程的寧夏在2023年便提出每年總計發(fā)放不超過4000萬元“算力券”,降低算力使用門檻,用于支持高校、科研機構、算力中介服務機構、科技型中小微企業(yè)和創(chuàng)客等使用區(qū)內超算、智算資源,開展核心算法創(chuàng)新、模型訓練研發(fā)等。
為了鼓勵更多企業(yè)加入到算力應用的隊伍,“算力券”還充當“體驗券”,吸引更多的企業(yè)“先嘗后買”。
“每周我們都會向各領域企業(yè)發(fā)放不少于2400小時的算力券。”南京智能計算中心運營總監(jiān)洪晨曦介紹,自推出算力券以來,該中心算力的平均使用率達到80%,峰值使用率接近100%,許多有算力需求的企業(yè)因此匹配到了合適的算力。
“我們要深化應用場景創(chuàng)新,釋放算力發(fā)展?jié)摿Γ诰蛉斯ぶ悄?、大?shù)據(jù)、工業(yè)互聯(lián)網、低空經濟等重點領域應用需求,促進算力資源與實體經濟深度融合,打造具有行業(yè)代表性和示范性的標桿應用,加速新技術與傳統(tǒng)產業(yè)的轉型升級。”魏亮說。
【深瞳工作室出品】
采寫:本報記者 都 芃
策劃:劉 恕 李 坤