av网址国产在线看,91亚洲中文国产综合

直擊WAIC丨專訪畢馬威中國張慶杰：算力如果不能普惠化任何AI暢想都是空中樓閣

2023-07-08 19:57:30 21世紀經(jīng)濟報道

作為支撐AI數(shù)據(jù)和模型的底層能量，算力正在成為數(shù)字經(jīng)濟時代新型生產(chǎn)力的主要形式，有望迎來重大發(fā)展機遇。

7月7日，在2023WAIC“計算+：讓人工智能更通用賦能”論壇上，畢馬威中國數(shù)字化賦能主管合伙人張慶杰接受了21世紀經(jīng)濟報道記者的專訪，在他看來，國內(nèi)各大科技公司近日紛紛推出了自家的大模型產(chǎn)品，AI大模型的競賽正在打響。未來行業(yè)應(yīng)該從“大規(guī)模、低成本與低能耗”三個方向來進一步夯實算力基礎(chǔ)。

“據(jù)公開資料，目前在追趕GPT3.5的中國團隊約有10個，在這一背景下，能否擁有或持續(xù)獲取算力將成為未來決定競爭格局的關(guān)鍵。”張慶杰說道。

(資料圖)

《21世紀》：您如何看待中國大模型的競爭現(xiàn)狀和發(fā)展前景？

張慶杰：大模型的核心技術(shù)壁壘是數(shù)據(jù)、算法、算力等要素資源的精巧組合，單純從時間維度來評價發(fā)展差距可能過于片面。能夠擁有或持續(xù)獲取算力將是決定未來競爭格局的關(guān)鍵。

AI大模型的真正價值最終將體現(xiàn)在具體場景，可以依靠“大模型+小模型”的方式來推進，即大小模型協(xié)同進化，在利用大參數(shù)訓(xùn)練完大模型之后，通過高精度壓縮，將大模型轉(zhuǎn)化為端側(cè)可用的小模型，大模型相當于超級大腦，小模型相當于垂直領(lǐng)域?qū)＜遥M而實現(xiàn)場景化應(yīng)用。

《21世紀》：您認為算力如何更好地支持大模型發(fā)展，還面臨哪方面挑戰(zhàn)？

張慶杰：中國是世界人工智能重要領(lǐng)軍國家之一，但做大模型還面臨多方面的挑戰(zhàn)，需要在政策、技術(shù)、資源、人才培養(yǎng)等方面進行綜合的改革和發(fā)展。

首先在計算資源方面，大模型的訓(xùn)練需要大量的計算資源，包括CPU、GPU、TPU等。雖然中國算力具備一定的基礎(chǔ)，但在計算資源方面還存在一定的短板，各行各業(yè)在底層計算資源上存在缺乏，這會限制大模型的訓(xùn)練和優(yōu)化。

除此之外，大模型的訓(xùn)練需要大量的高質(zhì)量數(shù)據(jù)，但是目前在數(shù)據(jù)質(zhì)量方面還存在一定的問題，包括數(shù)據(jù)噪聲、數(shù)據(jù)缺失、數(shù)據(jù)不平衡等問題。這會影響大模型的訓(xùn)練效果和準確性。

而在投入成本方面，大模型的訓(xùn)練需要大量的資金支持，包括硬件設(shè)備、人才引進、技術(shù)研發(fā)等方面的投入。最后，行業(yè)應(yīng)該在專業(yè)人才、技術(shù)生態(tài)以及計算架構(gòu)方面進行發(fā)力，來進一步夯實算力基礎(chǔ)。

《21世紀》：我國高度重視人工智能產(chǎn)業(yè)發(fā)展，智能算力發(fā)展的基礎(chǔ)在不斷夯實。請問智能算力如何推動人工智能的發(fā)展？

張慶杰：對通用人工智能（AGI）的來說，數(shù)據(jù)、算力、算法三大核心要素中，算力向下扎根于數(shù)據(jù)，向上支撐著算法，將是驅(qū)動AGI發(fā)展的核心動力。算力發(fā)展需要滿足大規(guī)模、低成本與低能耗三個方面。

首先在算力規(guī)模方面，在大數(shù)據(jù)、大模型、大算力的相互作用下，全球人均算力有望實現(xiàn)G-T-P三連跳，即從GFLOPS級別躍升到TFLOPS再到PFLOPS，乃至更高級別。正如工業(yè)經(jīng)濟模式下，人均用電量和人民生活質(zhì)量成正比，在數(shù)字經(jīng)濟時代，人均算力也將會是衡量人民智能化生活水平的重要指標，算力需同電力一樣成為規(guī)?；l(fā)展的公共資源。

但與此同時，大模型訓(xùn)練依然面臨著高昂的成本。放眼全球，除了幾大科技巨頭外，幾乎沒有企業(yè)承擔得起大模型訓(xùn)練的高昂成本，算力不實現(xiàn)普惠化，任何關(guān)于AI和科技革命的暢想都將是空中樓閣。

目前偏大規(guī)模的算力需求以B端和G端為主，算力降本需求十分迫切，要利用有限資金獲取更多元的算力，同時優(yōu)化算力資源配置和利用效率。

最后，低能耗也是行業(yè)需要探索的方向。數(shù)據(jù)中心是各國算力發(fā)展的重中之重，但也存在著嚴重的碳排放問題，隨著“碳中和”目標成為全球共識，大部分國家都提出了較為嚴格的數(shù)據(jù)中心節(jié)能減排要求。

《21世紀》：ChatGPT的出現(xiàn)具有顛覆性意義，中國可以從哪些方面發(fā)力去鼓勵ChatGPT這一類的技術(shù)顛覆式創(chuàng)新？

張慶杰：ChatGPT的顛覆性意義在于打破了以往人工智能技術(shù)發(fā)展的慣性思維，即從弱人工智能轉(zhuǎn)向強人工智能（也稱通用人工智能），智能不再局限于某些專用領(lǐng)域，如人臉識別、機器翻譯等，而是在盡可能多的領(lǐng)域中，幫助甚至代替人類執(zhí)行體力和智力任務(wù)。

對于鼓勵ChatGPT一類的技術(shù)顛覆式創(chuàng)新來說，中國可以從基礎(chǔ)研究、應(yīng)用創(chuàng)新發(fā)力等方面發(fā)力。

首先，基礎(chǔ)研究是整個科學(xué)體系的源頭，也是所有技術(shù)問題的總機關(guān)，在實現(xiàn)高水平科技自立自強、建設(shè)科技強國的時代背景下，基礎(chǔ)研究的重要性愈發(fā)凸顯。

中國近年來一直在持續(xù)加強基礎(chǔ)研究投入，科技部數(shù)據(jù)顯示，基礎(chǔ)研究經(jīng)費已從2012年的499億元增長到2022年的1951億元，年均增長近15%，接近全社會研發(fā)投入增長速度的2倍。在通用人工智能這一嶄新發(fā)展機遇面前，圍繞產(chǎn)出重大原創(chuàng)成果，堅持目標導(dǎo)向、市場導(dǎo)向和自由探索將有利于中國在人工智能領(lǐng)域取得重大突破。

與此同時，通用人工智能也應(yīng)當與經(jīng)濟社會深度融合，在重大應(yīng)用場景中錘煉技術(shù)。圍繞場景創(chuàng)新加快資本、人才、技術(shù)、數(shù)據(jù)、算力等要素匯聚，促進人工智能創(chuàng)新鏈、產(chǎn)業(yè)鏈深度融合，將會是推動通用人工智能落到實處的重要方式。

夯實底層算力。當前中國各大科技公司正不斷加碼算力進行大模型訓(xùn)練，普遍要承擔巨大的成本投入。

以構(gòu)建GPT-3為例，OpenAI數(shù)據(jù)顯示，滿足GPT-3算力需求至少要上萬顆英偉達GPU A100，一次模型訓(xùn)練總算力消耗約3,640PF-days（即每秒一千萬億次計算，運行3640天），成本超過1200萬美元，這還不包括模型推理成本和模型后續(xù)升級所需的訓(xùn)練成本。

因此，推動算力更加普適和智慧，才能切實助力科技企業(yè)等創(chuàng)新主體實現(xiàn)技術(shù)攻關(guān)。

《21世紀》：ChatGPT在聊天機器人、文本生成和語音識別等領(lǐng)域取得了巨大進展，未來大模型在實體行業(yè)的應(yīng)用前景如何？

張慶杰：ChatGPT在一定程度上驗證了沿著“大數(shù)據(jù)、大模型、大算力”路徑發(fā)展通用人工智能的可行性。目前，各類科技創(chuàng)新企業(yè)都在積極探索這種可能性，相關(guān)方向包括教育、移動、搜索引擎、內(nèi)容制作、醫(yī)藥等。

判斷這些應(yīng)用價值關(guān)鍵在于落地成效如何，需要技術(shù)提供商和應(yīng)用側(cè)企業(yè)共同厘清落地成效的具體維度和評估方式。

大模型在實體行業(yè)應(yīng)用中面臨的挑戰(zhàn)和算力的落地挑戰(zhàn)存在共性?？傮w來說，算力在各行業(yè)的落地挑戰(zhàn)主要包括算力總量亟需補充、邊緣算力較為緊缺、單位能耗算力性能有待提升、中心式計算架構(gòu)需轉(zhuǎn)型等。

預(yù)計隨著各行業(yè)全要素、全流程、全場景邁向數(shù)字化和智能化，實現(xiàn)“業(yè)務(wù)、數(shù)據(jù)、算力”之間的高效聯(lián)動，將是保證各類大模型或小模型按需匹配、精準賦能的重要前提。

（文章來源：21世紀經(jīng)濟報道）

關(guān)鍵詞：