6月8日-9日,36氪WAVES新浪潮2023大會在北京金海湖國際會展中心順利舉辦?!竁AVES」作為36氪全新推出的峰會IP,靈感來自于世界電影史上知名的“法國新浪潮電影運(yùn)動”。我們想借此表達(dá):年輕一代人不滿足于現(xiàn)狀、勇敢開拓和創(chuàng)造的精神。所以本次WAVES大會的slogan是:浪潮偏愛年輕人。
我們認(rèn)為,“年輕”不止是一個年齡上的概念,而更是一種對活力、想象力的描述。某種程度上,36氪就是一個伴隨著年輕一代創(chuàng)業(yè)者、或者說“創(chuàng)新精神”一起成長起來的公司。這也是我們一直引以為傲的一點(diǎn):在多數(shù)媒體還在追逐大公司的時代,我們就將目光著眼那些名不見經(jīng)傳的小公司、或“小人物”身上。
(資料圖片僅供參考)
WAVES新浪潮2023大會集聚創(chuàng)投、科技、人文、音樂多元場景,致力于打造出一場聚焦青年創(chuàng)始人和投資人的商業(yè)新勢力派對。
8日上午,針對新一輪的AI新浪潮所產(chǎn)生的影響,真格基金管理合伙人戴雨森、IDEA研究院講席科學(xué)家張家興、昆侖萬維 CEO方漢、中國人民大學(xué)高瓴人工智能學(xué)院教授盧志武、瀾舟科技合伙人、首席產(chǎn)品官李京梅與暗涌主筆于麗麗一起參與了主題為“被仰望的與被遺忘的”圓桌討論,以下為對話內(nèi)容,經(jīng)36氪編輯整理:
峰會現(xiàn)場
1.
36氪:我們這個環(huán)節(jié)的主題叫“被仰望的的與被遺忘的”,聽上去有一些抽象,其實想討論的是這一波AI新浪潮所超產(chǎn)生的影響,而所有的新浪潮都會有過度被推崇的部分和疏漏的部分。首先請各位老師介紹下自己,以及所在平臺正在做的大模型相關(guān)的一些情況。
戴雨森:真格基金是中國領(lǐng)先的天使投資基金,其實在過去十幾年我們投資了很多AI相關(guān)的項目,在大模型浪潮開始之后,我們發(fā)現(xiàn),很多過去投資過的項目,已經(jīng)成為了大模型浪潮中的中間力量。
比如說我們之前投了好幾家領(lǐng)先的AI芯片公司,像瀚博、沐曦、燧原等。大模型本身的話,我們新投了王慧文的光年之外,楊植麟的月之暗面這兩家做大模型的公司,以及我們在十幾年前就投了出門問問,他們也在自建大模型,叫做序列猴子。在AI領(lǐng)域需要的中間件,例如我們投資了潞晨科技,他們的開源框架在模型訓(xùn)練和推理加速里也是很受關(guān)注的。此外我們在應(yīng)用端也有一些相關(guān)的投資布局。
整體來講,在這一波AI新浪潮出現(xiàn)的時候,對于真格來說已經(jīng)不是一個新的浪潮,并且我們也感覺到很多新的機(jī)會正在重新屬于年輕人,所以我們還是比較激動的,從基金的角度和我個人的角度也花了很多的精力去關(guān)注和學(xué)習(xí)。
張家興:我是來自IDEA研究院的張家興,IDEA認(rèn)知計算與自然語言研究中心,大概兩年前成立,從成立就一直在做大模型,然后我們作為一個整個大模型的系列叫做風(fēng)神榜大模型系列,我們已經(jīng)開源100多個模型,從數(shù)量來說中國第一大的整個預(yù)系列模型體系,在ChatGTP出來之前做過各個機(jī)構(gòu)和垂直能力方面比較有影響力的一些工作,然后在這一次ChatGTP出來之后反正也是給大家一個很大的啟發(fā),然后證明了通用模型才是未來真正的發(fā)展方向,我們也是轉(zhuǎn)向?qū)iT做通用的大模型。
幾個星期前,我們也是剛剛開源我們風(fēng)神榜的下面一個新的子系列叫姜子牙系列,我們姜子牙預(yù)系列大模型也是在中文上非常好的表現(xiàn),我們也是開源出來,希望更多的人能夠用我們的模型做出一些好的工作出來。
方漢:我是昆侖萬維的CEO方漢,昆侖萬維是A股上市公司,主要的業(yè)務(wù)在海外,目前我們78%的營收來自于海外,在全球70多個國家和地區(qū)有業(yè)務(wù),全球的月活用戶4億左右,在海外我們做的業(yè)務(wù)主要是內(nèi)容與社交相關(guān)方向。在2020年6月GPT3出現(xiàn)之后,對我們觸動比較大,我們當(dāng)時判斷這是內(nèi)容生成領(lǐng)域的里程碑,所以我們從2020年8月就啟動大模型的研發(fā),2021年我們就發(fā)布了一個131億參數(shù)中文預(yù)訓(xùn)練大模型,同年我們啟動了音樂生成的研究工作,今年4月份我們也發(fā)布了一個千億級別的中文預(yù)訓(xùn)練大模型“天工”。
盧志武:大家好!我是來自人民大學(xué)的盧志武。我們團(tuán)隊其實從2020年就開始做大模型了,當(dāng)時做的第一個多模態(tài)大模型叫文瀾,在過去兩年有一些影響力。我們一直是做多模態(tài),我們現(xiàn)在的模型是ChatImg2.0版本。大家可以關(guān)注一下公眾號,可以試用一下,我自己覺得還可以。然后,我們學(xué)院昨天也發(fā)布了一個語言大模型叫玉蘭,是開源的,大家都可以試用看看效果怎么樣。
李京梅:我來自瀾舟科技,是一家兩年的創(chuàng)業(yè)公司。我們是2021年開始在李開復(fù)老師的創(chuàng)新工場孵化,今年已經(jīng)兩年了,我們的創(chuàng)始人周明老師之前是微軟亞洲研究院的副院長,也是NLP領(lǐng)域的專家。
我們公司的定位是一家認(rèn)知智能公司,在創(chuàng)業(yè)之初就開始做預(yù)訓(xùn)練模型,我們這個技術(shù)的名字叫孟子,比較中國化,也致敬了中國的傳統(tǒng)文化,所以我們比較關(guān)注中國市場中文這個領(lǐng)域大模型。
如今孟子已經(jīng)是我們的一個大模型的系列,只是在ChatGPT出來之前我們走的是輕量化的一個技術(shù)路線,今年有了ChatGPT的破圈,所以我們在技術(shù)上也做了一定的轉(zhuǎn)型。今年 3月份我們對外推出了自己的孟子生成式大模型(孟子GPT),5月份開始面向友好伙伴跟客戶做了邀請的測試,反響還不錯。
我們現(xiàn)在對外發(fā)布推出的是一個百億參數(shù)量的孟子GPT大模型,之后我們會繼續(xù)訓(xùn)練一些幾百億參數(shù)量的一個模型,所以瀾舟在孟子大模型賽道選型是基于通用模型底座,聚焦垂直領(lǐng)域和專業(yè)賽道。目前孟子大模型已經(jīng)落地金融、營銷、文化娛樂、還有機(jī)器翻譯這個領(lǐng)域,所以接下來我們也會持續(xù)基于我們自己的通用底座在行業(yè)這個大模型的賽道持續(xù)做商業(yè)化落地。在開源方面,從2021年開始,孟子一系列模型陸續(xù)入駐GitHub和Hugging?face開源社區(qū),同時,在阿里魔搭社區(qū)也開源了差不多20個左右的模型,接下來我們希望跟社區(qū)可以多做一些互動,收集反饋,我們也會持續(xù)做一些大模型的開源,這個是我們孟子大模型現(xiàn)在的一些進(jìn)展。
2.
36氪:剛才雨森也提到過,這一波浪潮對普通人和行業(yè)人士來說,感知上有明顯的時間差,所以第一個問題是,你們個人最早被大模型沖擊到大概是怎樣的一種場景和時刻?以及在這一波的浪潮中你們覺得可能真正的里程碑事件是什么?
戴雨森:AI在創(chuàng)投界近十幾年都是一個比較熱的話題,只是隨著一波一波新技術(shù)的興衰不斷進(jìn)入冬天和春天。但是這一次由ChatGPT引發(fā)的大模型熱潮其實有一個最不一樣的特點(diǎn),那就是它真正進(jìn)入了主流用戶的日常使用。最近有一個統(tǒng)計,ChatGPT的月活可能已經(jīng)過了十億。尤其在海外,我們會發(fā)現(xiàn),大量的辦公室工作者、學(xué)生、設(shè)計師等普通人都在大量使用ChatGPT或者M(jìn)idjourney這樣的產(chǎn)品,說明這一次生成式AI技術(shù)真正已經(jīng)到了跨越鴻溝進(jìn)入市場主流的階段。
與此同時,作為一個產(chǎn)品,我覺得ChatGPT是橫空出世的。因為我們之前也用過大量對話智能助手這樣的產(chǎn)品,基本還處在人工智障的階段。但是ChatGPT已經(jīng)具備了非常寬泛、非常通用的能力,這是之前任何產(chǎn)品都沒有過的。
對我自己來講使用這些產(chǎn)品的過程中有很多震撼時刻,比如說第一次用Midjourney訓(xùn)練出非常逼真的照片級的圖片的時候,又比如最近我有一個特別有趣的案例就是,claude?100K的模型發(fā)布后,我把張一鳴從12到16年的微博全部都丟進(jìn)去,我首先問這個作者是誰?它說不知道。但是我又問,你從已有的內(nèi)容,推理這個人創(chuàng)辦的公司2023年可能是什么樣? 它說第一這個公司應(yīng)該已經(jīng)是一家規(guī)模很大的互聯(lián)網(wǎng)公司、第二可能在重點(diǎn)開拓海外業(yè)務(wù),并且這個人可能23年已經(jīng)脫離一線管理了。我非常震驚,問:這你怎么知道的?Claude說從微博看出來,他對于復(fù)雜的管理并不是很感興趣,而且經(jīng)歷過創(chuàng)業(yè)十幾年可能已經(jīng)心生退意。雖然原因不是那么準(zhǔn)確,但是對結(jié)果的預(yù)計是非常非常有意思的。包括當(dāng)時看微軟的那篇文章Sparks?of?AGI也是發(fā)現(xiàn),之前像Lecun這樣的大佬以及很多專家都覺得大語言模型只是一個概率游戲,只是文本預(yù)測模型,不具備對世界的理解能力,但是你發(fā)現(xiàn)GPT4確實具備很多對世界理解的證據(jù),例如把獨(dú)角獸的角取下來,大模型說應(yīng)該裝上去,這里缺一個角。這些能力在我們過去看到的AI的產(chǎn)品或者技術(shù)里面還是比較罕見1的,所以我們現(xiàn)在對未來的可能充滿了興奮。
張家興:說起ChatGTP這個出來之后對我們的震撼,應(yīng)該說對我的震撼是非常大的,因為我個人來說我從12年開始做深度學(xué)習(xí),最近應(yīng)該說七八年一直在做自然語言這個方向,我們已經(jīng)算是讓這個領(lǐng)域有了很大的突破,但是終究有一些問題沒有解決的那么好,非常精準(zhǔn)的自然語言理解,完全受控的文本生成,用自然語言推理,其實在ChatGTP出來之前我過往的工作,尤其加入IDEA研究院很多工作都是這一方面,其實是有一些突破,過去一年是有一些突破,但是嚴(yán)格來說還都是非常漸進(jìn)式的一點(diǎn)一點(diǎn)上升,ChatGTP出來之后因為我覺得這就是GPT3又某一種升級,但是后來試了之后可以用一個詞來形容就是非常震撼。說實在至少中文領(lǐng)域英文也是差不多信息抽取最強(qiáng)的模型了,結(jié)果在ChatGPT出來之前人家沒有專門做這一件事情,依然效果強(qiáng)多少,所以讓我們意識到可能之前這個技術(shù)真的發(fā)生變化,以前我們曾經(jīng)的為每一個任務(wù)去設(shè)計模型結(jié)構(gòu),為每一個任務(wù)專門的去訓(xùn)練的這個時代過去了,我們終于從技術(shù)角度來說,通用這一件事情,終于成為一種可能,我們就做一個像ChatGPT這樣的模型,把所有的任務(wù)都放進(jìn)去之后,那既然每一個任務(wù)都比以前做的要好,而且這個提升是一個質(zhì)的提升。
盧志武:有兩個事情。一個是2021年,DALL-E剛出來的時候,做的文生圖效果確實讓人很驚艷,那個時候我覺得整個學(xué)術(shù)圈還是挺震驚的。另外一個就是大模型,今年GPT-4,雖然ChatGPT也很驚艷,但是GPT4還是給我?guī)砀蟮恼痼@,主要是什么?很多人用GPT-4評測以后,可能做了很嚴(yán)格的評測,認(rèn)為它具有早期的AGI能力,這個確實對我們沖擊特別大,因為所有做AI的人都是夢寐以求要實現(xiàn)AGI,現(xiàn)在有一個模型已經(jīng)開始具備AGI特質(zhì)了,肯定給我們帶來很多憧憬,當(dāng)然帶來很多挑戰(zhàn)。總之,這兩個事情對我影響是最大的。
李京梅:說起震撼,我也有一些體會。近十幾年我主要都是在做產(chǎn)品。早期做過研發(fā),純軟件工程。剛才家興講的今天大模型的可解釋性越來越黑客化,早期我做軟件工程師的時候,還是覺得軟件工程能夠做到一分努力一分耕耘,總是有一分結(jié)果,基本上是可預(yù)測、看得到,但是今天大模型之所以破圈,是因為很多時候超乎了人的預(yù)期。
再說近些年人工智能給我的一些感受,在2015年、2016年,那時候在微軟做認(rèn)知服務(wù)0到1的黑科技上云的工作,也是做產(chǎn)品工作,當(dāng)時的一個破圈事件是“how-old.net”,在座的有一定年齡,應(yīng)該有印象,那是我印象中能夠跟今天ChatGPT的破圈相提并論的。在普通群眾中破圈的是人臉識別,雖然界面就是個網(wǎng)頁,并沒有什么特別炫酷的交互或者視覺的沖擊力,但對于當(dāng)時來說,第一次發(fā)現(xiàn)人工智能跟你有這么近距離的體感,大家還是非常興奮的。
拉回到近期,跟我自己的經(jīng)驗非常相關(guān),當(dāng)時微軟從高科技、黑科技上云更多的是人臉識別、圖象識別、語音識別,還有一個language understanding,它是一個語言理解服務(wù),是一種感知智能,也就是看見、聽到,最多就是懂了。但是近些年,尤其是在去年開始講生成式AI,到去年9月底AIGC,其實主要是生圖,但是從AIGC本身來說,海外認(rèn)為的是生成式AI,從理解了、看見了、聽見了到能不能創(chuàng)造,這是非常大的里程碑,也是個人體感非常強(qiáng)烈的破圈,尤其是看到群眾興奮的在朋友圈以及群聊中去曬AI生成的圖。這個興奮的浪潮在持續(xù)高漲的過程中,ChatGPT又出來了,但僅是在技術(shù)圈里、AI圈里。
真正的破圈是到春節(jié)的時候,再一次的破圈以及震撼我的,準(zhǔn)確的是3月15號,GPT4出來了,然后沒幾天,17號微軟的Office“全家桶”出來了,雖然沒有直接上手可以試,但是當(dāng)你看到操作的視頻就會非常震憾,這個震撼在于這種創(chuàng)作型的、這種生成式的AI真的要去顛覆你身邊所有的應(yīng)用。因為這么多年大家感同身受,Office已經(jīng)很好了,但是如何把生成式AI創(chuàng)造智能,嵌入到身邊的這些應(yīng)用里,我覺得這幾個點(diǎn)是我個人特別特別關(guān)注的,主要還是從應(yīng)用的這個角度。
3.
36氪:回到當(dāng)下,過去幾個月稱得上國產(chǎn)大模型的春天,在你們看來,中國國產(chǎn)大模型相比美國真正的差距在哪里?其中關(guān)鍵問題是什么,這一浪潮中,中國跟世界的差距是拉大了還是縮小了?
戴雨森:從投資的角度觀察,目前算力、數(shù)據(jù)、算法各個方面都有一些積累上的差距。OpenAI在這個過程中,通過大量的資金、長期的研究和堅持打造了GPT4這樣非常強(qiáng)大的大模型。我們現(xiàn)在很多團(tuán)隊都是看到了ChatGPT的結(jié)果之后,才開始從資本的角度或者人才算力的角度去開始做,所以現(xiàn)在肯定是有一個比較大的差距,人家已經(jīng)跑前面去了,咱們才開始起跑,在比較短的時間內(nèi)這個差距會進(jìn)一步拉大。
整體來講的話,我覺得中國學(xué)者在AI領(lǐng)域的學(xué)術(shù)積累還是非常頭部的,其實在AI圈里面很多頂會論文,著名框架的發(fā)明人都是中國人,所以人才其實是不缺的,但是現(xiàn)在競爭格局比較分散,可能會影響到在尖端技術(shù)上的突破。我覺得百模大戰(zhàn)并不是一個好事兒,其實很多是行業(yè)浮躁和泡沫的體現(xiàn)。在喧囂之后如何盡快市場格局能夠收斂,把這些本來就比較稀少的資源集中起來重點(diǎn)突破,這個可能是我們要追趕或者在一些領(lǐng)域反超的路徑?,F(xiàn)在資源本來就少,分散到很多的項目和團(tuán)隊上,我覺得也是不太持續(xù)的。現(xiàn)在雖然做大模型的公司很多,但很多公司其實只是在用Supervised?Fine?Tuning等比較快捷的技術(shù)做一個語言能力還可以的模型出來,但是真正能夠資金實力和技術(shù)實力去挑戰(zhàn)GPT4以及更先進(jìn)技術(shù)的團(tuán)隊和項目可能還是比較少的。
張家興:首先我們還是要承認(rèn)國內(nèi)大模型跟OpenAI這個的差距,這個差距不光是我們跟他們的差距,國外很多公司跟他們之間也有很大的差距,這個主要原因是在于在ChatGPT出來之前,其實大模型這個領(lǐng)域已經(jīng)存在了,只不過這個領(lǐng)域?qū)儆诎倩R放的階段,大家有眾多的模型結(jié)構(gòu),針對不同的任務(wù)、不同的領(lǐng)域大家,也有不同的模型結(jié)構(gòu)跟訓(xùn)練方法的思考,呈現(xiàn)百花齊放的狀態(tài)。但是OpenAI堅持選擇了在當(dāng)時看來也是眾多方向中的一個方向,最終它勝利了,這是它本質(zhì)原因,這個方向確實堅持了很久了,他們做通用人工智能這件事情很早就在說,一幾年他們就在說這件事情,因為積累的比較多,這條道路勝利了,那么其他人不只是我們,包括美國的其他公司其實也都是在追趕的狀態(tài)。
中國來說,反正我們在追趕中有劣勢也有優(yōu)勢,劣勢剛才戴總也提到了包括資本的投入,甚至包括本身算力的規(guī)模,其實都是屬于一個劣勢,當(dāng)然我們也要看到優(yōu)勢,我們應(yīng)該看到這一代AI跟之前的AI本質(zhì)的不同。如果我們回想到2012年的時候,其實對今天這種情況還是樂觀的,中國整個學(xué)術(shù)界在世界上的話語權(quán)更加什么都沒有,因為當(dāng)時大家知道“三巨頭”以及他們的學(xué)生基本引領(lǐng)了整個領(lǐng)域。所以說中國其實深度學(xué)習(xí)過去十年中,比如說華人做出的有影響力工作不是特別多,很少的。
但是到了這個時代因為整個發(fā)生了變化,剛才盧老師也所了,學(xué)生都不知道該干啥了,整個AI技術(shù)的接力棒,前沿技術(shù)的接力棒已經(jīng)從研究走向了團(tuán)隊式的“研究+開發(fā)”,明顯呈現(xiàn)了一種工程化的趨勢,AI開始搞工程化的話,中國還是有很大的優(yōu)勢。過去十年,中國因為互聯(lián)網(wǎng)、數(shù)字化轉(zhuǎn)型積累了那么多算法工程師,尤其是懂深度學(xué)習(xí)的工程師,這都成為非常重要的人力資源,所以大家可以看到,這一波其實如果相對十年前我們追的是非??欤麄€中國追的是非??欤泻芏鄨F(tuán)隊都能做出比較像樣的模型,在逐漸拉近距離,承認(rèn)差距,結(jié)合我們現(xiàn)在的優(yōu)勢以及剛才說的對比,我們對當(dāng)下還是要充滿樂觀的。
方漢:因為我深度參與了大模型的訓(xùn)練過程,我來談?wù)勎易约旱母惺堋槭裁碠penAI被譏笑為CloseAI?其實大家會發(fā)現(xiàn),它在各種演講以及論文中公開了自己的數(shù)據(jù)及來源,也把自己的算法和訓(xùn)練步驟都講出來了,但是最保守的機(jī)密其實是如何對數(shù)據(jù)進(jìn)行預(yù)處理的階段,所以本質(zhì)上大模型的訓(xùn)練現(xiàn)在的差距其實是工程上的技巧,而OpenAI花了整整五年時間在這方面去積累,其實我覺得這是全世界所有其他公司同OpenAI的差距。
但是我們認(rèn)為,工程上的差距一定是可以追平的,只要有海量的試錯機(jī)會。但是從另外一個角度而言,我們與美國很大的一個差距就是我們在大模型訓(xùn)練底層技術(shù)上仍然有差距,例如OpenAI覺得效率不夠高,會寫自己的compiler,但是中國有能力做這樣的公司寥寥無幾。
我剛才跟大家分享過,我天天在讀大模型相關(guān)的論文,我有個習(xí)慣,當(dāng)我看到一篇論文有意思的話,我一定會聯(lián)系作者,去和作者交流。在我目前感興趣的論文中,中國的博士寫出來的論文大概占1%的話,那么美國人寫出來的論文大概能占2%,其中,美國博士論文里能占到2%的部分中有一半是中國人寫的,所以我個人對國內(nèi)大模型的前景比較樂觀。在下一代大模型創(chuàng)新中,我們中國的主力是這批正在讀書的博士,我覺得他們的水平以及創(chuàng)新能力并不弱于美國人,只要我們給他們機(jī)會,他們一定會成長起來。如果需要我現(xiàn)在舉出有中國科研人員引領(lǐng)的項目案例,我能舉出來很多,我個人還是比較偏樂觀的。
盧志武:我覺得國內(nèi)跟國外最大的差別還是說,如果從大語言模型上,最大的差別就是說大家都沉不下心把底座做好,你剛才說國產(chǎn)大模型的春天,這個都是假象,因為大部分都是微調(diào)國外底座模型的。
方漢:我是堅決反對,我們自己做大模型訓(xùn)練,可以很清楚的告訴你們,中國第一批出來的大模型里面,這么說吧,至少我可以拍著胸脯保證,我們天宮跟它一毛錢的關(guān)系都沒有,因為我們從2020年開始做了,連OPT都沒有,我覺得你也不能一棒子都打死。
盧志武:我知道,但是你這個我不太清楚,我看到了很多,因為一測就知道。當(dāng)然也有一些團(tuán)隊在模型底座上投入很多精力,大部分還是很浮躁的。我反而覺得語言模型上面差距會越來越大。
36氪:盧老師是更悲觀的一個視角。
盧志武:為什么會是這樣,看一堆模型出來了,只是因為這個語言模型架構(gòu)已經(jīng)公布了,但是如果沒有公布,為什么前面不出來,這不是很奇怪的一個事兒嗎?我覺得不符合邏輯的,大家都不愿意去做底座。從這個角度,大家能不能跳出語言模型?反正已經(jīng)落后了,當(dāng)然有人要追。有沒有別的方面還能追得上的?GPT4的框架是未知的,大家都是公平的,我們就去探索,在這個點(diǎn)上我們追上它還是有可能的,并且GPT-4訓(xùn)練算力耗得那么多,OpenAI自己它也承受不了,如果要把視頻加進(jìn)去,我估計也做不好。總之,從這種角度,真正把類GPT-4模型做出來,我覺得大家都是公平的,有機(jī)會追得上的。我認(rèn)為語言模型上反而沒什么機(jī)會。
方漢: ?我堅決反對上一位老師的觀點(diǎn),我們自己做大模型訓(xùn)練,在中國第一批出來的大模型中,我可以拍著胸脯保證,我們昆侖萬維發(fā)布的“天工”大模型跟外網(wǎng)的開源模型一點(diǎn)關(guān)系也沒有,因為我們從2020年就開始做中文預(yù)訓(xùn)練大模型的研發(fā),2021年發(fā)布了140億參數(shù)的中文預(yù)訓(xùn)練大模型,那個時間點(diǎn)世界上還沒有任何公開的開源GPT大模型可以參考。
李京梅:今天無論哪一個評測榜或者企業(yè)自評,國內(nèi)還沒有哪一家說我已經(jīng)跟ChatGPT,不要講GPT4,就是ChatGPT3.5,能夠比肩了。今天這種現(xiàn)狀,從創(chuàng)業(yè)公司做商業(yè)化落地的角度看,是否考慮過即使今天ChatGPT在中國并且在你手里,可以做私有化嗎?是不是可以用起來?我覺得答案也是否定的。
我們看了很多行業(yè),尤其是行業(yè)性較強(qiáng)的,比如金融行業(yè),它的數(shù)據(jù)并不能放到互聯(lián)網(wǎng)上,還是有很多私域數(shù)據(jù)。不管是行業(yè)的習(xí)慣還是監(jiān)管或者其他原因,總之這個數(shù)據(jù)并不飄在互聯(lián)網(wǎng)上,這種數(shù)據(jù)也不是純粹的底座技術(shù)就可以解決的。所以能看到,即使有了這樣的底座,通用的能力,還是要加工程。所謂的工程就是今天在行業(yè)里看到如何解決準(zhǔn)確性的問題,GPT4比GPT3.5提升了很多。所以從落地應(yīng)用的角度看,無論是自研的還是基于開源的LLaMA模型,微調(diào)后怎么去用,需要把最后一公里,可能不止一公里,十公里也好,要去做好。這是一個我覺得國內(nèi)在人工智能技術(shù)、AI工程或者軟件工程里面,一定可以用上的策略。在剖析了OpenAI團(tuán)隊后,其實是有很多華人甚至國內(nèi)留學(xué)去的,所以人才方面我們完全不落后,這是都能有目共睹的。
這是一個落地層面。翻回來,從我觀察來看,無論是去年的AIGC還是今天的ChatGPT,這些技術(shù)大家都去追了,會不會哪天世界某個角落又蹦出新的技術(shù),我們又沒有跟上?所以前瞻性的研究需要長期堅持。從創(chuàng)業(yè)、商業(yè)化角度分析,越前瞻、越看不清的東西,成功的幾率也是越低的。再從投資角度來說,是否有資本愿意做長期的投入?這些不是某一個人或者某一個公司可以解決的,我也沒有答案。?OpenAI它不是一夜成名,不是一夜暴富,雖然OpenAI沒有把論文發(fā)出來,但是它的技術(shù)2017年就有了,前期的臟活苦活累活也都干了,所以其實也是長期的堅持。微軟雖然投入了,微軟自己的研究院也沒有先做出來,谷歌這么多年AI的標(biāo)簽,也沒有先做出來。所以概括來說,前瞻性技術(shù)型的研究投入以及高校人才的培養(yǎng),是需要引導(dǎo)的,也是一個長期堅持的事情。
4.
36氪:各位老師怎么看大模型未來的競爭格局,哪些參與者可能能存活下來,現(xiàn)在的普通創(chuàng)業(yè)者是否還有參與的機(jī)會,另外關(guān)于大模型的創(chuàng)業(yè),關(guān)于它的商業(yè)化路線一直存在很多爭議,很多人說在中國做大模型單純走2C的路線是很艱難,所以想問一怎么看2C和2B它可能面對的機(jī)會和挑戰(zhàn)?
戴雨森:我感覺在中國做2B服務(wù)可能更艱難,至少做過企業(yè)服務(wù)的創(chuàng)業(yè)者應(yīng)該會有更深刻的感受。中國互聯(lián)網(wǎng)之前一大特點(diǎn)就是要直接找用戶收錢很難,很多時候都是「羊毛出在豬身上」,企業(yè)服務(wù)的格局也會受到市場付費(fèi)意愿、客戶采購方式特點(diǎn)的限制。我倒是覺得面向消費(fèi)者應(yīng)用的機(jī)會在中國還是很大的,雖然咱們跑出來的應(yīng)用商業(yè)模式跟美國ChatGPT?Midjourney直接賣用戶訂閱估計還是會一如既往的有很大區(qū)別。
企業(yè)服務(wù)領(lǐng)域,OpenAI和Claude在美國可以直接通過公有云賣API服務(wù),但在中國估計只是提供API還不夠,我聽說很多做大模型的公司針對企業(yè)客戶現(xiàn)在是連服務(wù)器帶模型一起賣,還得提供訓(xùn)練和微調(diào)服務(wù)。
然后顯然上百個模型混戰(zhàn)肯定不是長期的狀態(tài),我覺得這里面分幾類:
第一類就是真的能夠往智能前沿探索,我覺得這么多大佬都說AGI是比互聯(lián)網(wǎng)更大的機(jī)會,這個的立足點(diǎn)是我們能做出能夠使用工具、解決任務(wù)、分解任務(wù)的AGI,這樣的實現(xiàn)需要非常強(qiáng)的能力,坦率來講已經(jīng)超越了傳統(tǒng)NLP 任務(wù)的范疇.所以我覺得這個可能能持續(xù)做到世界領(lǐng)先水平的人哪怕是在美國也會是比較少的。
第二類機(jī)會,可能在垂直領(lǐng)域里,比如說醫(yī)療、法律這些原來薪酬比較高的領(lǐng)域,可能可以使用大模型再加上垂直領(lǐng)域的數(shù)據(jù)進(jìn)行精調(diào),來創(chuàng)造對應(yīng)的copilot。在這些垂直細(xì)分領(lǐng)域,可能我們不需要把所有的領(lǐng)域任務(wù)都做的那么好,這個可能是行業(yè)應(yīng)用機(jī)會。
第三類機(jī)會,我堅信在應(yīng)用端肯定會有很多很有意思的機(jī)會。我們看到了在美國Midjourney、Jasper這些產(chǎn)品都是用戶很喜歡,商業(yè)化很優(yōu)秀的。我們也有投資做應(yīng)用的公司,推出的產(chǎn)品在國外反響也很好。有人說這些應(yīng)用是不是就是GPT套殼,我認(rèn)為這個領(lǐng)域技術(shù)可能不是最關(guān)鍵的,重要的是怎么把大模型的能力和用戶場景有效的對應(yīng)起來,給用戶提供價值,長期來看是靠專有的用戶數(shù)據(jù)和關(guān)系,以及用戶習(xí)慣和品牌等形成壁壘。
其實仔細(xì)想想,首先iPhone發(fā)布之前,投移動互聯(lián)網(wǎng)應(yīng)用基本上沒有跑出來的。但2007年iPhone發(fā)布后,要在頭幾年去預(yù)測十年后移動互聯(lián)網(wǎng)的終局形態(tài)和大贏家也是很難的,我們在2010年是基本不可能想清楚最后是字節(jié)、快手、拼多多、美團(tuán)、小紅書這些商業(yè)模式最后成為中國移動互聯(lián)網(wǎng)的大贏家。因此在這一波AI技術(shù)革命的早期,我們堅持以創(chuàng)業(yè)者為中心,相信優(yōu)秀的創(chuàng)業(yè)者最后終究會找到方向。
總結(jié)來講我覺得中國2C比2B機(jī)會大,最后不需要那么多真正的大模型,而是需要很多在垂直領(lǐng)域能夠解決問題的模型和產(chǎn)品。
張家興:我也同意戴總的觀點(diǎn),我們不一定非得說有一個通用大模型,要更多的垂直領(lǐng)域的這些模型,然后這一塊就是對于整個大模型的落地以及它的整個商業(yè)化,我一直有一個想法大家如何去思考我們通用大模型這些事情,它到底是像OPENAI給大家呈現(xiàn)出來的,或者是2C產(chǎn)品,還是怎么去想?
其實我還是把這個東西類比成當(dāng)年的深度學(xué)習(xí),因為我也是完整的經(jīng)歷了整個深度學(xué)習(xí)的周期,就是實際上通用大模型是一門技術(shù),就跟當(dāng)年深度學(xué)習(xí)出來之后,因為深度學(xué)習(xí)之前,其實機(jī)器學(xué)習(xí)一直都存在,只不過它各方面做的不好,所以說很多場景,要么效果不好,要么沒辦法應(yīng)用,深度學(xué)習(xí)全部刷了一遍,包括后來10年之后大家見到很多互聯(lián)網(wǎng)的一些應(yīng)用,包括一些比如說短視頻直播都是跟深度學(xué)習(xí)技術(shù)有關(guān),否則不可能出現(xiàn)。
那么大模型也一樣,現(xiàn)在看到通用大模型也是一樣,其實更多的是對我們以前曾經(jīng)的這種AI化的,我們說這個世界在信息化、數(shù)字化、AI化,我們AI化的一個進(jìn)一步的深化吧,從這種情況下實際上作為一個技術(shù)來說,它是要有一個完整的生態(tài)體系的,從這生態(tài)體系來說。
但是深度學(xué)習(xí)因為那個時代技術(shù)應(yīng)該或者說它的復(fù)雜程度或者成本沒有達(dá)到那個程度,就是這個生態(tài)體系還沒有劃分的很清楚,但是到模型不得不進(jìn)行生態(tài)體系的建設(shè),因為大家知道做一個通用大模型確實成本太高,也需要專門的投入和專門化的團(tuán)隊來做,所以最上游一些做通用大模型的公司,接著往下沿著大模型做各方面垂直大模型,然后還有做各個行業(yè)落地的以及每個行業(yè)里面自己在應(yīng)用它去做事情,以及過程中云廠家包括做算力各個廠家在里面,整個生態(tài)體系,如果大家看到這個生態(tài)體系的話,就會發(fā)現(xiàn)這里面機(jī)會蠻多,而不是聽聽眼睛就得盯著做什么什么模型,不是這樣機(jī)會非常多。
我覺得第一個當(dāng)做技術(shù)來看,必然會在各個場景要有應(yīng)用,也絕不是一個通用大模型就能解決全部場景問題,需要每一個場景針對場景做自己的模型,每一個場景中讓每一個模型跟你的場景能夠形成這樣一個閉環(huán),場景越好就你涉及到的數(shù)據(jù)越多模型越好,再就是說站在一個馬上就要展開的生態(tài)角度來看,想一想自己可以占據(jù)哪個生態(tài)位。
方漢:首先,各種各樣的小模型的能力其實嚴(yán)重依賴于大模型底座;第二,2B或者2C的機(jī)會,中國與國外的競爭格局完全不一樣,但是也有一些相對共通的方面,目前在中國2B端很難有一家獨(dú)大的情況,而是比較碎片化,大模型在B端的應(yīng)用是一個大家都能賺到錢、但是大家又很難賺到特別多錢的局面。對于一家創(chuàng)業(yè)公司而言,B端還是一個不錯的起點(diǎn)。
對于C端而言,我覺得分兩個方向,一是效率工具,也就是說我們把大模型作為我們?nèi)粘9ぷ鞯囊粋€效率工具。在這一點(diǎn)上,我認(rèn)為,國外的訂閱模式,在中國一定不會成功,中國一定是免費(fèi)模式,中國模式的效率工具入口已經(jīng)被office、企業(yè)AIM等就是我們上班打開的工具入口占領(lǐng),目前創(chuàng)業(yè)公司的機(jī)會其實不多,因為很難改變用戶的習(xí)慣,去創(chuàng)造另外一個工具的入口。但是在另外一個領(lǐng)域,所謂的內(nèi)容生成領(lǐng)域,創(chuàng)業(yè)公司的機(jī)會就會更多一些,因為在這個領(lǐng)域,大公司其實沒有把用戶的心智徹底壟斷掉,用戶就是相對碎片化。
最后,其實這一波大模型或者通用人工智能的是遠(yuǎn)遠(yuǎn)超過產(chǎn)品進(jìn)展,我也經(jīng)常跟中國的最頂尖的產(chǎn)品經(jīng)理聊,我感覺產(chǎn)品經(jīng)理是處在很懵的狀態(tài),大模型是很厲害,能用來干什么?我覺得要給我們中國的產(chǎn)品經(jīng)理一些耐心,我相信通過這些產(chǎn)品經(jīng)理的創(chuàng)意以及努力,能夠打破現(xiàn)在的范式。
目前B端和C端的競爭實際上還是1.0模式,就是老的商業(yè)模式去套大模型來做我們的創(chuàng)業(yè)方向,我認(rèn)為必然有2.0模式,就是徹底摒棄現(xiàn)在傳統(tǒng)商業(yè)模式,利用大模型的能力去創(chuàng)造出新的商業(yè)范式,我個人認(rèn)為,在中國可以再創(chuàng)造出下一代的BAT和TMD,我認(rèn)為是有這個機(jī)會的。
盧志武:其實我們2020年把文瀾模型做出來以后,一直在探索這個落地。但是這個落地很難,就是大模型落地確實有很多問題。當(dāng)然到今天為止,還是有一些自己的想法,雖然我是個教授,主要在學(xué)校,我認(rèn)為大模型落地目前就是API調(diào)用的方式,還有一種大模型的定制化或者行業(yè)里面再去重新訓(xùn),我覺得這兩種方式其實都不是很好的。API調(diào)用有很明顯的問題,比如說很多場景,政府的場景,因為數(shù)據(jù)的問題不可能讓你去調(diào)的。
然后定制化也是一個苦活,雖然也能復(fù)制,但其實每一家它都有自己的特別要求,最后變成一個一個做項目,這兩個事情我都做過,就比如說我們跟榮耀也做過,反正最后變成做項目,能賺錢但是很辛苦,就這樣的。所以我最近也在探索想一個新的路,我正好是做多模態(tài)大模型,因為多模態(tài)可以接攝像頭,而很多硬件都是有攝像頭,那可以把模型集成在一個硬件里面,比如說無人機(jī)、機(jī)器人這樣,我們就變成了去賣產(chǎn)品,可能是一條新路,可以避免我剛才說的兩個問題,然后API調(diào)用很多場景用不了,其實成本也挺高的,如果變成做產(chǎn)品可能稍微會好一點(diǎn),這是我們的探索。
另外,文生圖這個領(lǐng)域我覺得小B還是有機(jī)會的,我們最近也在這個上面探索。
李京梅:瀾舟科技是一個創(chuàng)業(yè)公司,我們?nèi)缃褡龃竽P鸵灿猩罡袠I(yè)的模型,針對這幾年探討的ToB和Not ToB,瀾舟的商業(yè)化賽道主要是B端,也包括一些文化娛樂、營銷,我們是通過ToB再ToC。每一個企業(yè)都有自己的基因和選擇的賽道,B端這個賽道我覺得今天中國跟海外有一些差異,早期我在美國也做過不少B端的服務(wù)型的一些工作。
在國內(nèi),?ToB產(chǎn)品或者解決方案必須一家從頭做到尾,其實是可以分層,比如做底座或者工具平臺。我相信大模型跟數(shù)據(jù)是在一起的,如果是互聯(lián)網(wǎng)公開數(shù)據(jù),那它就是在互聯(lián)網(wǎng)上,如果是行業(yè)的數(shù)據(jù),那它就應(yīng)該在行業(yè)里,數(shù)據(jù)在哪,大模型就在哪,但當(dāng)前是否具備相關(guān)的人才呢?所以無論是哪個行業(yè),還是要有行業(yè)能夠降低落地的成本、應(yīng)用的這種工具型的平臺,比如分層底座的工程平臺、行業(yè)的端到端應(yīng)用、效率型的工具,這也是一種產(chǎn)品。并不局限于群眾可以直接體驗到、能夠上手的、可以日常用的才叫產(chǎn)品。所以無論是ToC還是ToB,大模型的商業(yè)化落地,在國內(nèi)都還沒有那么清楚,但能夠看到這種浮躁的這種熱潮已經(jīng)降溫,尤其B端已經(jīng)開始進(jìn)行理性化的思考。
我覺得接下來的這個商業(yè)化,尤其是在B端的一些賽道,當(dāng)然我們也是有選擇,有一些是包容性比較容錯性高一些,肯定是先能落地,寫網(wǎng)文營銷尤其是社媒上的營銷,但是金融容錯率比較低,我覺得這是有一個過程,目前我們還是走垂直領(lǐng)域?qū)I(yè)賽道,在B端或者是在一些細(xì)分的行業(yè)里愿意跟市場、跟客戶一起去探索往前,最主要的ToB還是Not ToB還是做出價值,這是我現(xiàn)在的觀點(diǎn)。
5.
36氪:本來還有更長問題,因為時間關(guān)系縮減一下,這一波AI新浪潮讓很多的白領(lǐng)可能會被替代的焦慮中,如果是面對一個擇業(yè)的年輕人或者教育孩子的家長,各位老師會有何建議,能否用一句話概括一下。
戴雨森:就跟當(dāng)時互聯(lián)網(wǎng)一樣,擁抱新技術(shù)、學(xué)習(xí)新技術(shù)、成為新技術(shù)專家,這個是最直接的。
張家興:不要去做那些所有人都能做的事情,盡量發(fā)現(xiàn)自己與眾不同的事情,因為所有人能做的事情,現(xiàn)在機(jī)器都做的挺好的。
方漢:大家不用杞人憂天,我覺得下一代更善于利用AI,更善于去開發(fā)AI,對于我們來說,只要永遠(yuǎn)保持一顆好奇的心態(tài),就不會被各種各樣新技術(shù)淘汰。
盧志武:擁抱AI。
李京梅:要有一個與時俱進(jìn)的心態(tài),保持持續(xù)學(xué)習(xí)的心態(tài),就不會被時代淘汰。
關(guān)鍵詞: