通信世界網(wǎng)消息(CWW)2024年大模型技術(shù)加速迭代、產(chǎn)品豐富多樣、應(yīng)用多點(diǎn)開(kāi)花,助力千行百業(yè)加速智能化轉(zhuǎn)型,掀起變革浪潮?!?025年大模型將角逐下半場(chǎng),需要新打法。”12月18日,在2025年ICT行業(yè)趨勢(shì)年會(huì)“算網(wǎng)與AI大模型應(yīng)用論壇”上,中國(guó)信通院云計(jì)算與大數(shù)據(jù)研究所所長(zhǎng)何寶宏講道。
何寶宏在演講中指出,2024年,全球訓(xùn)練大語(yǔ)言模型的效果普遍不及預(yù)期,可能已經(jīng)撞上“數(shù)據(jù)墻”。如OpenAI產(chǎn)品迭代明顯放緩;Anthroipc暫停Calude 3.5 Opus開(kāi)發(fā)。另外,大模型產(chǎn)品迭代的速度也明顯在放緩,這些情況表明,大模型競(jìng)賽的上半場(chǎng)已經(jīng)進(jìn)入“垃圾時(shí)間”。
對(duì)于大模型下半場(chǎng)的主賽道與新打法,何寶宏表示,大模型的下半場(chǎng)競(jìng)賽可以有多個(gè)可選的轉(zhuǎn)變:從訓(xùn)練轉(zhuǎn)為推理,從語(yǔ)言大模型轉(zhuǎn)到多模態(tài)大模型,從人類互聯(lián)網(wǎng)數(shù)據(jù)轉(zhuǎn)為AI合成數(shù)據(jù)和私域數(shù)據(jù),從閉源過(guò)渡到基于開(kāi)源,從拼性能到拼性價(jià)比,從虛擬智能到實(shí)體智能等。
具體來(lái)看,行業(yè)要“卷”合成數(shù)據(jù),也需要謹(jǐn)慎。過(guò)去30年來(lái)互聯(lián)網(wǎng)上積累的數(shù)據(jù),將在未來(lái)3~5年內(nèi)被AI耗盡。但與此同時(shí),Meta等的研究發(fā)現(xiàn),即使只用了1%的合成數(shù)據(jù),也將導(dǎo)致嚴(yán)重的模型崩潰。此外,現(xiàn)在互聯(lián)網(wǎng)上超過(guò)50%的流量是機(jī)器人在搬運(yùn),接下來(lái)網(wǎng)上將充斥著人工智能生成的內(nèi)容人類生成的高質(zhì)量數(shù)據(jù)很可能會(huì)被淹沒(méi)在AI生成的垃圾堆里。
“卷”開(kāi)源,領(lǐng)先的開(kāi)源模型的能力已經(jīng)達(dá)到閉源模型能力的80%,但成本卻是閉源模型的1/20,那在大部分場(chǎng)景下會(huì)選擇開(kāi)源模型。從效果來(lái)看,集中式訓(xùn)練大模型已經(jīng)導(dǎo)致對(duì)一般性智算需求的大降,加速大模型應(yīng)用的私有化部署,行業(yè)大模型也將加速落地。
“卷”工程,大模型工程化過(guò)程中,長(zhǎng)推理范式、可解釋性與透明度、可靠性與安全性、壓縮與輕量化、MLOps、記憶能力等方面仍是機(jī)會(huì),仍有待突破。
“卷”性價(jià)比,一方面,根據(jù)相關(guān)測(cè)算,AI年產(chǎn)值超過(guò)6000億美元,才夠支付AI基礎(chǔ)設(shè)施的費(fèi)用,但現(xiàn)在還缺5000億,且2024年5月開(kāi)始的價(jià)格戰(zhàn)目前暫無(wú)停止的跡象。另一方面,國(guó)內(nèi)單位算力成本大致相當(dāng)于英偉達(dá)算力的1.5倍,但同等的大語(yǔ)言模型服務(wù)價(jià)格經(jīng)常只有它的20%到50%。接下來(lái),行業(yè)會(huì)更關(guān)注商業(yè)化和應(yīng)用落地,更注重性價(jià)比。
而在接下來(lái)大模型自身主攻方向轉(zhuǎn)變的同時(shí),算力等基礎(chǔ)設(shè)施、智能體等應(yīng)用也將迎來(lái)更為徹底的變革。
大模型下半場(chǎng),智能體將接棒大模型。何寶宏表示,盡管少數(shù)巨頭在繼續(xù)探索通用大模型的未知邊界,但更多數(shù)企業(yè)將聚焦探索各類LLM的好用(優(yōu)化)和多用(場(chǎng)景)的路線,即Agent。未來(lái)幾年,Agent泡沫將興起,但Agent會(huì)有遺傳自LLM的“故疾”(如不可解釋性和幻覺(jué))。另外,LLM的本質(zhì)是壓縮,Agent的本質(zhì)是目標(biāo)導(dǎo)向,二者本質(zhì)的不同,導(dǎo)致未來(lái)可能會(huì)出現(xiàn)三個(gè)問(wèn)題:難以覺(jué)察的終極目標(biāo)不一致性;難以理解的機(jī)器陌生的思維和行為方式;AI系統(tǒng)缺失的自我修正機(jī)制。
大模型下半場(chǎng),算力不能只追求高性能。算力發(fā)展也將有三大轉(zhuǎn)變,一是發(fā)展邊緣算力、混合算力、云端算力、推理算力、節(jié)能算力、低成本算力等多樣化算力。二是從IDC到AIDC,之前IDC是技術(shù)創(chuàng)新的制高點(diǎn),而現(xiàn)在AIDC不僅僅是技術(shù)創(chuàng)新,而是將重構(gòu)整個(gè)生態(tài),覆蓋Agent、網(wǎng)絡(luò)、芯片、風(fēng)火水電等方方面面。三是從缺算到缺電,近年來(lái)數(shù)據(jù)中心耗電量持續(xù)上升,2030年AIDC耗電量將占全球總電量的20%,人工智能將激活全球核電市場(chǎng)。
大模型下半場(chǎng),液冷從小眾走向剛需。數(shù)據(jù)顯示,2023年中國(guó)液冷服務(wù)器市場(chǎng)規(guī)模15.5億美元,同比增長(zhǎng)52.6%,未來(lái)五年年復(fù)合增長(zhǎng)率將達(dá)到45.8%。未來(lái)AIDC幾乎都要采用液冷解決方案,液冷將迎來(lái)爆發(fā)風(fēng)口。
大模型下半場(chǎng),信息基礎(chǔ)設(shè)施要智力在線。隨著科技變革,行業(yè)已經(jīng)建成了龐大的通信基礎(chǔ)設(shè)施,正在大規(guī)模建設(shè)算力基礎(chǔ)設(shè)施,開(kāi)始試點(diǎn)數(shù)據(jù)基礎(chǔ)設(shè)施,接下來(lái)還要探索和大力發(fā)展智力基礎(chǔ)設(shè)施。
- QQ:61149512