·GPT-4只能和數(shù)字世界打交道,我們最終必須跟物理世界打交道,這就需要機(jī)器人,也就是具身智能。
·全世界對(duì)大模型強(qiáng)大的生成能力、遷移能力、交互能力感到驚訝卻無法解釋,只能歸結(jié)為“涌現(xiàn)”。為了人工智能產(chǎn)業(yè)的健康發(fā)展,必須將科學(xué)研究、技術(shù)創(chuàng)新、產(chǎn)業(yè)發(fā)展結(jié)合起來。要發(fā)展第三代人工智能,必須建立可解釋和魯棒的人工智能理論與方法,否則AI技術(shù)永遠(yuǎn)難以令人相信。
“通向通用人工智能的道路雖然依然艱難,但大語言模型為AI產(chǎn)業(yè)的發(fā)展打開了一條通向通用AI的寬廣道路。”中國科學(xué)院院士、清華大學(xué)人工智能研究院院長、清華大學(xué)計(jì)算機(jī)系教授張鈸公開表示,大模型提供了發(fā)展通用硬件和軟件的機(jī)會(huì)。
傳統(tǒng)AI范式利用特定的算法和規(guī)則完成特定任務(wù),生成式AI范式是基于一種稱為基礎(chǔ)模型的通用模型,通過廣泛文本數(shù)據(jù)的訓(xùn)練,在開領(lǐng)域(open domain,開域)內(nèi)可以生成類似人類水平的高質(zhì)量文本、圖像和其他內(nèi)容,通過微調(diào)等方式適配于廣泛的下游任務(wù)。生成式AI已經(jīng)向通用AI邁出一步,第二步是AI智能體,第三步則是具身智能?!癎PT-4只能和數(shù)字世界打交道,我們最終必須跟物理世界打交道,這就需要機(jī)器人,也就是具身智能?!睆堚撜f,“具身智能的提出有助于構(gòu)造完整的智能體,讓智能體既有感知,又有思考。不一定要做人形機(jī)器人,因?yàn)楹芏鄷r(shí)候只要用手或腳就可以了,不需要把硬件搞得非常復(fù)雜?!彼鲝堃砸欢ǖ挠布榛A(chǔ)進(jìn)行強(qiáng)化學(xué)習(xí)研究。
張鈸表示,生成式AI大模型具備三大能力和一大缺點(diǎn),即強(qiáng)大的生成能力、強(qiáng)大的遷移(推廣)能力、強(qiáng)大的交互能力和幻覺。強(qiáng)大的語言生成能力可基于上下文和過去的對(duì)話,在開領(lǐng)域生成多樣性類似人類的連貫文本。強(qiáng)大的遷移能力可以在代理任務(wù)上訓(xùn)練一個(gè)模型,通過細(xì)調(diào)適配到感興趣的下游任務(wù)。強(qiáng)大的交互能力包括與人類的交互(人機(jī)交互)、機(jī)器之間的交互(多智能體)、與環(huán)境的交互(具身智能),通過交互在不同專業(yè)和科學(xué)的測試基準(zhǔn)上表現(xiàn)出人類水平的智能。而針對(duì)幻覺,大模型有時(shí)會(huì)生成看似合理的編造或無意義的答案。
在工作替代性方面,張鈸表示,人工智能有助于推動(dòng)經(jīng)濟(jì)增長,建筑、維護(hù)、安裝等行業(yè)難以被自動(dòng)化和智能化,但行政管理等白領(lǐng)工作或可以被AI替代。AI可以提高大多數(shù)人類工作的質(zhì)量和效率,但被AI完全替代的工作仍是少數(shù)。之所以AI還不能替代大多數(shù)工作,是因?yàn)榇竽P瓦€存在難以逾越的天花板。張鈸表示,大模型的所有工作都是外部提示而非主動(dòng),并且在外部提示的情況下利用概率預(yù)測完成任務(wù),而人類的工作依靠內(nèi)部意圖驅(qū)動(dòng)。大語言模型生成語言與人類語言生成只是有行為上的相似性,其內(nèi)在機(jī)制根本不同,大語言模型存在不自知、質(zhì)量不可控、不可信、不魯棒(魯棒性,指系統(tǒng)對(duì)異常情況的適應(yīng)能力)等天花板,給出不同的提示詞,大模型會(huì)輸出不同的回答。“不管模型多么大,幻覺這個(gè)缺點(diǎn)一直存在?!睆堚撜f。
張鈸提出,要發(fā)展第三代人工智能,必須建立可解釋和魯棒的人工智能理論與方法,發(fā)展安全、可控、可信、可靠、可擴(kuò)展的AI技術(shù),推動(dòng)AI的創(chuàng)新應(yīng)用和產(chǎn)業(yè)化。如果不能建立可解釋和魯棒的人工智能理論,AI技術(shù)是不可靠的,AI技術(shù)永遠(yuǎn)難以令人相信?!暗浆F(xiàn)在為止,這個(gè)理論還沒有建立起來,這也是人工智能發(fā)展緩慢和曲折的原因。理論建立不起來,是因?yàn)槭艿饺齻€(gè)特定限制,過去只能在特定領(lǐng)域利用特定模型解決特定任務(wù),這不利于建立通用理論,而大模型的出現(xiàn)為建立這個(gè)理論提供了可能性?!?/p>
張鈸表示,大模型為我們提供了發(fā)展通用硬件和軟件機(jī)會(huì)。人工智能正進(jìn)入穩(wěn)步發(fā)展階段,對(duì)各行各業(yè)有巨大影響,必須抓住機(jī)遇發(fā)展人工智能產(chǎn)業(yè)。但仍有大量不確定性,因?yàn)锳I不可預(yù)測、不可控。全世界對(duì)大模型強(qiáng)大的生成能力、遷移能力、交互能力感到驚訝,卻無法解釋,只能歸結(jié)為“涌現(xiàn)”。所以為了人工智能產(chǎn)業(yè)的健康發(fā)展,必須將科學(xué)研究、技術(shù)創(chuàng)新、產(chǎn)業(yè)發(fā)展結(jié)合起來。