日前,在剛剛舉行的2023云棲大會(huì)上,百川智能創(chuàng)始人王小川暢談大模型時(shí)代,復(fù)旦特聘教授漆遠(yuǎn)借助復(fù)旦大學(xué)智能計(jì)算平臺(tái)CFFF引出人工智能推動(dòng)科研范式變革,也有基于AIGC能力的兒童故事產(chǎn)品帶來(lái)分享。
當(dāng)一場(chǎng)云計(jì)算大會(huì)由AI相關(guān)內(nèi)容占據(jù)主論壇的半壁江山,或許已經(jīng)說(shuō)明了“計(jì)算”風(fēng)向:AI正在成為不可忽視的計(jì)算主角。
AIGC將有更多爆發(fā)2024年是大模型商業(yè)化元年
過(guò)去十來(lái)年,云計(jì)算不斷發(fā)展、應(yīng)用,服務(wù)了社會(huì)數(shù)字化進(jìn)程。今天,隨著大模型技術(shù)的迅速發(fā)展,智能化時(shí)代正在開啟。人工智能將成為各行各業(yè)的新型生產(chǎn)力,以ChatGPT為代表的大模型應(yīng)用僅僅是一個(gè)開始。
今年以來(lái),眾多大模型產(chǎn)品發(fā)布,基于大模型的AIGC技術(shù)在文本生成、知識(shí)回答、圖像生成、邏輯推理等方面表現(xiàn)出遠(yuǎn)超預(yù)期的效果,吸引了大量用戶與市場(chǎng)關(guān)注。
以生產(chǎn)力視角看,AIGC具備多方面優(yōu)勢(shì),第一是大幅度節(jié)省人力和時(shí)間成本,很多東西可以秒級(jí)生成;第二是比較大幅度改善內(nèi)容質(zhì)量,經(jīng)過(guò)訓(xùn)練后輸出的內(nèi)容質(zhì)量超過(guò)95%以上人力的智能。
國(guó)內(nèi)推出的過(guò)百個(gè)大模型以基礎(chǔ)大模型為主,多停留在對(duì)話、圖像生成用途,AIGC的第三點(diǎn)優(yōu)勢(shì)尚不能體現(xiàn),即如同曾經(jīng)云計(jì)算帶來(lái)的數(shù)字化變革一般,將有助于眾多產(chǎn)業(yè)、行業(yè)的數(shù)字化,將為數(shù)字經(jīng)濟(jì)建設(shè)發(fā)揮重要作用。
因此,行業(yè)認(rèn)為當(dāng)下的AIGC火爆只是剛剛開始,后續(xù)還將迎來(lái)更多爆發(fā)。
圖源《中國(guó)AIGC產(chǎn)業(yè)全景報(bào)告暨AIGC 50》
《中國(guó)AIGC產(chǎn)業(yè)全景報(bào)告暨AIGC 50》顯示,預(yù)計(jì)2023年我國(guó)市場(chǎng)規(guī)模可達(dá)170億人民幣,AIGC企業(yè)在業(yè)務(wù)場(chǎng)景變現(xiàn)還處于探索驗(yàn)證時(shí)期。而后隨著產(chǎn)業(yè)加速增長(zhǎng),商業(yè)化落地逐漸深入、產(chǎn)業(yè)生態(tài)逐步完善,分別來(lái)到應(yīng)用蓬勃期(2025-2027)和整體加速期(2028-2030),2030年市場(chǎng)規(guī)模將超萬(wàn)億人民幣,產(chǎn)業(yè)鏈、價(jià)值鏈和業(yè)務(wù)鏈完全整合在一起。
在AIGC產(chǎn)品百花齊放的同時(shí),變現(xiàn)是大模型廠商們接下來(lái)必須要考慮的問(wèn)題。
目前大模型的營(yíng)收方式主要有四種:MaaS、按產(chǎn)出內(nèi)容量付費(fèi)、軟件訂閱付費(fèi)、模型定制開發(fā)費(fèi)。ChatGPT主要依賴軟件訂閱付費(fèi)和MaaS收入,其母公司OpenAI的CEO近日透露公司年化營(yíng)收達(dá)13億美元(折合人民幣近95億)。
國(guó)內(nèi)廠商尚在進(jìn)行商業(yè)模式的探索,是參考ChatGPT還是綁定其他業(yè)務(wù)賺錢,大模型的營(yíng)收變現(xiàn)有待進(jìn)一步明確。有AI芯片企業(yè)負(fù)責(zé)人表示,今年下半年開始,商業(yè)模式如何賺錢將成為大模型廠商的必答題。
他認(rèn)為,2024年將是大模型商業(yè)化的元年,也是關(guān)鍵一年。
智算需求只增不減明年迎海量部署消耗
看得見的AIGC蓬勃發(fā)展背后,是看不見的智能算力在支撐。
大模型爆發(fā)掀起了新一輪AI熱潮,也改變了智能算力需求與格局。
眾所周知,AI要經(jīng)過(guò)訓(xùn)練與推理兩個(gè)步驟,訓(xùn)練即模型產(chǎn)生的過(guò)程,推理即模型部署的過(guò)程。大模型從業(yè)者向筆者表示,大模型出來(lái)后則分成了三個(gè)階段:首先預(yù)訓(xùn)練,然后微調(diào)——把大模型垂直化,最后是推理部署。
“現(xiàn)在預(yù)訓(xùn)練的過(guò)程中,大家都是堆卡、堆集群,動(dòng)不動(dòng)燒幾千萬(wàn)上億訓(xùn)練大模型。微調(diào)階段就已經(jīng)進(jìn)入了行業(yè)化,做推理的時(shí)候已經(jīng)進(jìn)入了商業(yè)部署,這兩個(gè)階段怎樣真正賺錢而不是像預(yù)訓(xùn)練那樣燒錢就變得非常重要。行業(yè)化和商業(yè)化的關(guān)鍵在于性價(jià)比,如何能夠真正大規(guī)模部署AI應(yīng)用,能不能通過(guò)底部支撐的算力系統(tǒng)集成部署打造極致性價(jià)比?”
產(chǎn)業(yè)專家指出,總體來(lái)看,大模型所需的智能算力需求將只增不減。今年通用大模型最火,單模型算力需求基本以千P為單位。未來(lái)大模型必然要走專業(yè)化、行業(yè)化的發(fā)展方向,形成眾多產(chǎn)業(yè)大模型,其算力單個(gè)需求可能只有幾百P,但產(chǎn)業(yè)場(chǎng)景越來(lái)越多,總量需求將比現(xiàn)有通用大模型的智能算力總需求更大。
智能算力從哪來(lái)?智算中心
根據(jù)工信部等六部門新政策中的定義,使用大規(guī)模異構(gòu)算力資源,包括通用算力(CPU)和智能算力(GPU、FPGA、ASIC等),主要為人工智能應(yīng)用——如人工智能深度學(xué)習(xí)模型開發(fā)、模型訓(xùn)練和模型推理等場(chǎng)景,提供所需算力、數(shù)據(jù)和算法的智算中心,在推進(jìn)人工智能和數(shù)字經(jīng)濟(jì)發(fā)展中發(fā)揮著重要作用。
成都智算中心
大模型需求驅(qū)動(dòng)下,智算中心項(xiàng)目如雨后春筍般涌現(xiàn)。中國(guó)信通院云大所副所長(zhǎng)栗蔚指出,預(yù)計(jì)2023年將有超過(guò)30個(gè)城市在建或者籌建智算的中心。而據(jù)中國(guó)IDC圈不完全統(tǒng)計(jì),僅在2023年7月到9月,以“智算中心”為名字的項(xiàng)目規(guī)劃在建及建成的就超過(guò)36個(gè),預(yù)計(jì)總投資規(guī)模超過(guò)460億。
有算力領(lǐng)域企業(yè)表示,當(dāng)前一些智算中心建設(shè)偏盲目,邏輯是“先建算力,再找需求”。
他判斷未來(lái)會(huì)趨向謹(jǐn)慎,尤其是to G(政府主導(dǎo))的智算中心建設(shè)。2024年國(guó)內(nèi)智算中心建設(shè),一定是先找當(dāng)?shù)氐乃懔ο{,再根據(jù)算力需求再建相關(guān)算力匹配。
“2024年大模型會(huì)大規(guī)模部署、賦能,這一過(guò)程中對(duì)于算力的消耗是海量的。”
從液冷應(yīng)用到多云部署大模型改變數(shù)據(jù)中心
智能化時(shí)代正在開啟,AI將成為各行各業(yè)的新型生產(chǎn)力,也對(duì)算力提出更高的要求。
今天,從大模型服務(wù)到底層智能算力再到算力基礎(chǔ)設(shè)施,都正在面向AI時(shí)代進(jìn)行全面的技術(shù)升級(jí)和創(chuàng)新。
算力市場(chǎng)分為三個(gè)層級(jí),在大模型位于的最上層,面臨系統(tǒng)的適配中心、業(yè)務(wù)遷移耗時(shí)、定制開發(fā)的投入等問(wèn)題。中層的算力平臺(tái)需要滿足支持CPU+GPU的調(diào)用、硬件接口的統(tǒng)一、互聯(lián)協(xié)議的標(biāo)準(zhǔn)、軟件生態(tài)的兼容性等要求。在最下層,即智算中心這一基礎(chǔ)設(shè)施層,主要解決大算力背景下的高電能散熱問(wèn)題。
此前數(shù)據(jù)中心以普通CPU服務(wù)器為主,AI大模型訓(xùn)練和推理運(yùn)算使用GPU服務(wù)器,單臺(tái)設(shè)備的額定功率最高達(dá)12千瓦以上,遠(yuǎn)超CPU功率水平。當(dāng)前數(shù)據(jù)中心單機(jī)柜功率以6kw、8kw為主,4KW亦不少見,未來(lái)智算中心單機(jī)柜功率可能十幾千瓦,幾十千瓦,單體智算中心可能上百兆瓦。
高功耗帶來(lái)高熱量,原有風(fēng)冷很難滿足GPU散熱需求,液冷成為更好的解決方案。除散熱效率更高外,占地面積低、綠色節(jié)能也是液冷的優(yōu)勢(shì)。今年以來(lái),液冷在數(shù)據(jù)中心的應(yīng)用部署量已經(jīng)顯著上升。
當(dāng)單個(gè)計(jì)算中心的算力無(wú)法滿足大模型的巨大算力需求,需要將多個(gè)算力中心連接起來(lái),共同為大模型提供訓(xùn)練的相關(guān)能力,同時(shí)巨大算力消耗又帶來(lái)高能源消耗。
因此,單機(jī)柜高功率、高效散熱、低PUE、多云間的互聯(lián)、滿足云架構(gòu)的部署,都是大模型發(fā)展對(duì)智能算力與智算中心提出諸多新要求。
此外,大模型訓(xùn)練與推理場(chǎng)景的不同,生物醫(yī)療、圖像識(shí)別等不同應(yīng)用對(duì)算力精度的不同需求,也影響著智算的布局與算力配置。
更多內(nèi)容,將在IDCC2023上帶來(lái)分享與討論!
第十八屆中國(guó)IDC產(chǎn)業(yè)年度盛典(IDCC2023)將于2023年12月12-14日在北京國(guó)家會(huì)議中心隆重舉行,大會(huì)主題為“算力進(jìn)化數(shù)字開物”,聚焦算力產(chǎn)業(yè)熱點(diǎn)話題,匯聚業(yè)內(nèi)精英人士,共同探討數(shù)字經(jīng)濟(jì)的發(fā)展方向和未來(lái)趨勢(shì)。歡迎報(bào)名,現(xiàn)場(chǎng)參與!