AI巔峰之作:還會犯錯(cuò)的GPT4對誰有用?
2023-03-17 12:16:47    騰訊網(wǎng)

3月15日凌晨1點(diǎn),OpenAI正式推出GPT4文本生成AI系統(tǒng) 。相比GPT3.5,GPT4的用戶體驗(yàn)大大改進(jìn),其功能性和準(zhǔn)確度均有不小提高,更被openAI視為里程碑。但是,不足之處仍然存在,GPT4的邏輯推理能力依然有不小的提高空間。

我們依然要冷靜,一半天才一半白癡的AI雨人,不會取代底層打工人的崗位,更不能高估GPT4的消費(fèi)性應(yīng)用價(jià)值。


(資料圖片)

GPT4真正的優(yōu)勢體現(xiàn)是在全球大國AI 軍備競賽中,GPT4具備分析全球互聯(lián)網(wǎng)大數(shù)據(jù)情報(bào)的超能力,有人會為此積極買單。

1.GPT4比chatGPT高在哪里?

一是功能高。根據(jù)官方介紹,GPT-4是一個(gè)多模態(tài)大型語言模型,即支持圖像和文本輸入,以文本形式輸出;擴(kuò)寫能力增強(qiáng),能處理超過25000個(gè)單詞的文本;更具創(chuàng)造力,并且能夠處理更細(xì)微的指令。

大型語言模型已經(jīng)由chatGPT科普過了,如何理解這里的黑話“多模態(tài)”?文字輸入文字表達(dá)即為單模態(tài),現(xiàn)在的 GPT-4可以接收圖片輸入,使用文字輸出的表達(dá),以后還會有視頻輸入文字輸出,這被稱為多模態(tài)。

多模態(tài)比純文字就是高,與此前的GPT系列模型相比,這是GPT-4最大的突破之一。

不過該功能還沒有全面開通。OpenAI創(chuàng)始人Sam Altman當(dāng)晚在社交媒體介紹稱,他們正在預(yù)覽GPT-4的圖片輸入模式,以防止可能出現(xiàn)的安全倫理問題。

二是準(zhǔn)確度高。

OpenAI表示,新模型產(chǎn)生的錯(cuò)誤答案更少,將更少地偏離談話軌道,更少地談?wù)摻稍掝},甚至在許多標(biāo)準(zhǔn)化測試中比人類表現(xiàn)得更好。

OpenAI稱,該公司花費(fèi)6個(gè)月的時(shí)間,利用對抗性測試程序和ChatGPT的經(jīng)驗(yàn)教訓(xùn)迭代調(diào)整GPT-4,從而在真實(shí)性、可操縱性和拒絕超出設(shè)定范圍方面取得了有史以來最好的結(jié)果。

官方羅列了一些證據(jù)認(rèn)為,GPT4高級推理能力超過chatGPT。

例如,它在模擬律師考試中的得分能夠名列頭部10%左右,相比之下,GPT-3.5的得分只能排在尾部10%左右。

OpenAI稱,在公司內(nèi)部的對抗性真實(shí)性評估中,GPT-4的得分比最新的GPT-3.5高40%,相應(yīng)的“不允許內(nèi)容請求的傾向”降低了 82%,根據(jù)政策響應(yīng)敏感請求(如醫(yī)療建議和自我傷害)的頻率提高了29%。

不僅是英語,該模型在多種語言方面均表現(xiàn)出優(yōu)越性。OpenAI稱,在測試的26種語言中,GPT-4在24種語言方面的表現(xiàn)均優(yōu)于GPT-3.5等其他大語言模型的英語語言性能。其中GPT-4的中文能夠達(dá)到80.1%的準(zhǔn)確性,而GPT-3.5的英文準(zhǔn)確性僅為70.1%,GPT-4英文準(zhǔn)確性提高到了85.5%。

“這是OpenAI努力擴(kuò)展深度學(xué)習(xí)的最新里程碑?!監(jiān)penAI介紹。

2.不過,AI仍然不可靠。

盡管 GPT4進(jìn)步不小,但與早期的GPT模型一樣,GPT4仍然存在許多不足。

我覺著吧,經(jīng)過測試可以發(fā)現(xiàn),GPT4在知識的廣度、專業(yè)和學(xué)術(shù)表達(dá)方面的確表現(xiàn)較好,做到了“一本正經(jīng)”;但是智商方面,近似于人類小學(xué)生,還是常常會“說胡話”,尤其是數(shù)理運(yùn)算公式方面,還沒上幼兒園。

這是個(gè)明顯的弱點(diǎn)。

一半天才一半白癡,這算是人類制造的機(jī)器“雨人”。

OpenAI也認(rèn)識到了這一點(diǎn) ?!癎PT-4缺乏對絕大多數(shù)數(shù)據(jù)切斷后(2021年9月)發(fā)生的事件的了解,并且無法從中吸取經(jīng)驗(yàn)教訓(xùn)……它有時(shí)會出現(xiàn)簡單的推理錯(cuò)誤,它會輕信用戶明顯的虛假陳述,有時(shí)它會像人類一樣在難題上失敗,例如在它生成的代碼中引入安全漏洞?!?/p>

基于此,OpenAI提醒,用戶在使用語言模型時(shí)應(yīng)格外小心,最好輔助以人工審查、附加上下文、或完全避免在高風(fēng)險(xiǎn)情況下使用它。

3.這種AI工具對誰有用?

從AI智障到AI雨人,算是整個(gè)行業(yè)的進(jìn)步。為此,openAI正在積極推進(jìn)。openAI正在大舉招兵買馬,手里有微軟送過來的100億美元新軍費(fèi),未來十幾年不愁資金問題,現(xiàn)在駕馭著微軟提供的全球第二算力的微軟云,正向全球頂級AI大牛發(fā)出橄欖枝。

“隨著我們繼續(xù)專注于可靠的擴(kuò)展,我們的目標(biāo)是完善我們的方法,以幫助我們越來越多地提前預(yù)測和準(zhǔn)備未來的能力——我們認(rèn)為這對安全至關(guān)重要?!?/p>

同時(shí),為了保持核心競爭能力,openAI已經(jīng)對GPT模型完全封鎖。在目前OpenAI公開的技術(shù)報(bào)告或公關(guān)文稿中,不包含任何關(guān)于模型架構(gòu)、硬件、算力等方面的更多信息,也不包括期待已久的 AI 視頻功能,也并沒有GPT4的任何核心技術(shù)論文信息。沒有人能拿到GPT3.5內(nèi)部細(xì)節(jié),更別奢望現(xiàn)在的GPT4了。

OpenAI對用戶開放API接口,你可以調(diào)用它,設(shè)計(jì)自己簡陋的APP。但是,你卻要源源不斷的輸送數(shù)據(jù),幫它完善模型,提升模型準(zhǔn)確度,甚至還要為此主動付費(fèi)。這真是一門好生意。

鑒于GPT與中文世界一貫的保持了無形的距離,這個(gè)距離暫時(shí)無法打破;鑒于某些山寨品與GPT4.0差距實(shí)在太大,速成品就更沒法比了,因此,關(guān)于市場應(yīng)用和投資前景,依然不能著急。因此,你不能天真的以為,生成式AI可能快速改變各行各業(yè),并且可能加強(qiáng)每個(gè)人的創(chuàng)造能力與挖掘每個(gè)人的新需求,更不能隨意看好全球算力+軟件棧行業(yè)、模型+云計(jì)算行業(yè),應(yīng)用+傳感器行業(yè)。

GPT4在公開情報(bào)分析方面具備超能力,這個(gè)能力遠(yuǎn)遠(yuǎn)大于搜索引擎,也超過了許多NSA數(shù)據(jù)武器(論證略),現(xiàn)在解決了多模態(tài)問題,無論音視頻、圖片還是文字,機(jī)器人通吃。如果你要分析互聯(lián)網(wǎng)大數(shù)據(jù)的秘密,并且發(fā)現(xiàn)需要的情報(bào),那么GPT這樣的機(jī)器人是不是就會很有用處?

不光如此,微軟還要把旗下搜索引擎bing與GPT4融合。bing解決了AI訓(xùn)練所需的互聯(lián)網(wǎng)數(shù)據(jù)源問題,GPT解決了數(shù)據(jù)分析輸出問題,bing+GPT=new bing……

我想美國政府、情報(bào)機(jī)構(gòu)和軍方一定會積極買單。他們不光利用聊天機(jī)器人技術(shù)分析全球情報(bào),還可以偷偷地訓(xùn)練機(jī)器人撒謊。

GPT從1.0走了3.5,又從3.5走到4.0,而許多國家還在停留2.0-3.0的水平上,原地不動。

眼下要錢沒錢,要人沒人,要算力沒算力。跟是跟不上了,必須另辟蹊徑。

關(guān)鍵詞: