作為支撐AI數(shù)據(jù)和模型的底層能量,算力正在成為數(shù)字經(jīng)濟時代新型生產(chǎn)力的主要形式,有望迎來重大發(fā)展機遇。
7月7日,在2023WAIC“計算+:讓人工智能更通用賦能”論壇上,畢馬威中國數(shù)字化賦能主管合伙人張慶杰接受了21世紀經(jīng)濟報道記者的專訪,在他看來,國內(nèi)各大科技公司近日紛紛推出了自家的大模型產(chǎn)品,AI大模型的競賽正在打響。未來行業(yè)應(yīng)該從“大規(guī)模、低成本與低能耗”三個方向來進一步夯實算力基礎(chǔ)。
“據(jù)公開資料,目前在追趕GPT3.5的中國團隊約有10個,在這一背景下,能否擁有或持續(xù)獲取算力將成為未來決定競爭格局的關(guān)鍵。”張慶杰說道。
(資料圖)
《21世紀》:您如何看待中國大模型的競爭現(xiàn)狀和發(fā)展前景?
張慶杰:大模型的核心技術(shù)壁壘是數(shù)據(jù)、算法、算力等要素資源的精巧組合,單純從時間維度來評價發(fā)展差距可能過于片面。能夠擁有或持續(xù)獲取算力將是決定未來競爭格局的關(guān)鍵。
AI大模型的真正價值最終將體現(xiàn)在具體場景,可以依靠“大模型+小模型”的方式來推進,即大小模型協(xié)同進化,在利用大參數(shù)訓(xùn)練完大模型之后,通過高精度壓縮,將大模型轉(zhuǎn)化為端側(cè)可用的小模型,大模型相當于超級大腦,小模型相當于垂直領(lǐng)域?qū)<遥M而實現(xiàn)場景化應(yīng)用。
《21世紀》:您認為算力如何更好地支持大模型發(fā)展,還面臨哪方面挑戰(zhàn)?
張慶杰:中國是世界人工智能重要領(lǐng)軍國家之一,但做大模型還面臨多方面的挑戰(zhàn),需要在政策、技術(shù)、資源、人才培養(yǎng)等方面進行綜合的改革和發(fā)展。
首先在計算資源方面,大模型的訓(xùn)練需要大量的計算資源,包括CPU、GPU、TPU等。雖然中國算力具備一定的基礎(chǔ),但在計算資源方面還存在一定的短板,各行各業(yè)在底層計算資源上存在缺乏,這會限制大模型的訓(xùn)練和優(yōu)化。
除此之外,大模型的訓(xùn)練需要大量的高質(zhì)量數(shù)據(jù),但是目前在數(shù)據(jù)質(zhì)量方面還存在一定的問題,包括數(shù)據(jù)噪聲、數(shù)據(jù)缺失、數(shù)據(jù)不平衡等問題。這會影響大模型的訓(xùn)練效果和準確性。
而在投入成本方面,大模型的訓(xùn)練需要大量的資金支持,包括硬件設(shè)備、人才引進、技術(shù)研發(fā)等方面的投入。最后,行業(yè)應(yīng)該在專業(yè)人才、技術(shù)生態(tài)以及計算架構(gòu)方面進行發(fā)力,來進一步夯實算力基礎(chǔ)。
《21世紀》:我國高度重視人工智能產(chǎn)業(yè)發(fā)展,智能算力發(fā)展的基礎(chǔ)在不斷夯實。請問智能算力如何推動人工智能的發(fā)展?
張慶杰:對通用人工智能(AGI)的來說,數(shù)據(jù)、算力、算法三大核心要素中,算力向下扎根于數(shù)據(jù),向上支撐著算法,將是驅(qū)動AGI發(fā)展的核心動力。算力發(fā)展需要滿足大規(guī)模、低成本與低能耗三個方面。
首先在算力規(guī)模方面,在大數(shù)據(jù)、大模型、大算力的相互作用下,全球人均算力有望實現(xiàn)G-T-P三連跳,即從GFLOPS級別躍升到TFLOPS再到PFLOPS,乃至更高級別。正如工業(yè)經(jīng)濟模式下,人均用電量和人民生活質(zhì)量成正比,在數(shù)字經(jīng)濟時代,人均算力也將會是衡量人民智能化生活水平的重要指標,算力需同電力一樣成為規(guī)?;l(fā)展的公共資源。
但與此同時,大模型訓(xùn)練依然面臨著高昂的成本。放眼全球,除了幾大科技巨頭外,幾乎沒有企業(yè)承擔得起大模型訓(xùn)練的高昂成本,算力不實現(xiàn)普惠化,任何關(guān)于AI和科技革命的暢想都將是空中樓閣。
目前偏大規(guī)模的算力需求以B端和G端為主,算力降本需求十分迫切,要利用有限資金獲取更多元的算力,同時優(yōu)化算力資源配置和利用效率。
最后,低能耗也是行業(yè)需要探索的方向。數(shù)據(jù)中心是各國算力發(fā)展的重中之重,但也存在著嚴重的碳排放問題,隨著“碳中和”目標成為全球共識,大部分國家都提出了較為嚴格的數(shù)據(jù)中心節(jié)能減排要求。
《21世紀》:ChatGPT的出現(xiàn)具有顛覆性意義,中國可以從哪些方面發(fā)力去鼓勵ChatGPT這一類的技術(shù)顛覆式創(chuàng)新?
張慶杰:ChatGPT的顛覆性意義在于打破了以往人工智能技術(shù)發(fā)展的慣性思維,即從弱人工智能轉(zhuǎn)向強人工智能(也稱通用人工智能),智能不再局限于某些專用領(lǐng)域,如人臉識別、機器翻譯等,而是在盡可能多的領(lǐng)域中,幫助甚至代替人類執(zhí)行體力和智力任務(wù)。
對于鼓勵ChatGPT一類的技術(shù)顛覆式創(chuàng)新來說,中國可以從基礎(chǔ)研究、應(yīng)用創(chuàng)新發(fā)力等方面發(fā)力。
首先,基礎(chǔ)研究是整個科學(xué)體系的源頭,也是所有技術(shù)問題的總機關(guān),在實現(xiàn)高水平科技自立自強、建設(shè)科技強國的時代背景下,基礎(chǔ)研究的重要性愈發(fā)凸顯。
中國近年來一直在持續(xù)加強基礎(chǔ)研究投入,科技部數(shù)據(jù)顯示,基礎(chǔ)研究經(jīng)費已從2012年的499億元增長到2022年的1951億元,年均增長近15%,接近全社會研發(fā)投入增長速度的2倍。在通用人工智能這一嶄新發(fā)展機遇面前,圍繞產(chǎn)出重大原創(chuàng)成果,堅持目標導(dǎo)向、市場導(dǎo)向和自由探索將有利于中國在人工智能領(lǐng)域取得重大突破。
與此同時,通用人工智能也應(yīng)當與經(jīng)濟社會深度融合,在重大應(yīng)用場景中錘煉技術(shù)。圍繞場景創(chuàng)新加快資本、人才、技術(shù)、數(shù)據(jù)、算力等要素匯聚,促進人工智能創(chuàng)新鏈、產(chǎn)業(yè)鏈深度融合,將會是推動通用人工智能落到實處的重要方式。
夯實底層算力。當前中國各大科技公司正不斷加碼算力進行大模型訓(xùn)練,普遍要承擔巨大的成本投入。
以構(gòu)建GPT-3為例,OpenAI數(shù)據(jù)顯示,滿足GPT-3算力需求至少要上萬顆英偉達GPU A100,一次模型訓(xùn)練總算力消耗約3,640PF-days(即每秒一千萬億次計算,運行3640天),成本超過1200萬美元,這還不包括模型推理成本和模型后續(xù)升級所需的訓(xùn)練成本。
因此,推動算力更加普適和智慧,才能切實助力科技企業(yè)等創(chuàng)新主體實現(xiàn)技術(shù)攻關(guān)。
《21世紀》:ChatGPT在聊天機器人、文本生成和語音識別等領(lǐng)域取得了巨大進展,未來大模型在實體行業(yè)的應(yīng)用前景如何?
張慶杰:ChatGPT在一定程度上驗證了沿著“大數(shù)據(jù)、大模型、大算力”路徑發(fā)展通用人工智能的可行性。目前,各類科技創(chuàng)新企業(yè)都在積極探索這種可能性,相關(guān)方向包括教育、移動、搜索引擎、內(nèi)容制作、醫(yī)藥等。
判斷這些應(yīng)用價值關(guān)鍵在于落地成效如何,需要技術(shù)提供商和應(yīng)用側(cè)企業(yè)共同厘清落地成效的具體維度和評估方式。
大模型在實體行業(yè)應(yīng)用中面臨的挑戰(zhàn)和算力的落地挑戰(zhàn)存在共性??傮w來說,算力在各行業(yè)的落地挑戰(zhàn)主要包括算力總量亟需補充、邊緣算力較為緊缺、單位能耗算力性能有待提升、中心式計算架構(gòu)需轉(zhuǎn)型等。
預(yù)計隨著各行業(yè)全要素、全流程、全場景邁向數(shù)字化和智能化,實現(xiàn)“業(yè)務(wù)、數(shù)據(jù)、算力”之間的高效聯(lián)動,將是保證各類大模型或小模型按需匹配、精準賦能的重要前提。
(文章來源:21世紀經(jīng)濟報道)
關(guān)鍵詞: