本文來自微信公眾號(hào) “混沌大學(xué)”(ID:hundun-university),作者:混沌學(xué)園,36氪經(jīng)授權(quán)發(fā)布。
編者按:本文來自微信公眾號(hào) 光錐智能(ID:guangzhui-tech),作者:魏琳華,編輯:王一粟,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
為什么推薦你看看劉嘉老師的觀點(diǎn)?
劉嘉老師是清華大學(xué)心理與認(rèn)知科學(xué)系主任、清華大學(xué)基礎(chǔ)科學(xué)講席教授、智源人工智能研究院首席科學(xué)家。
而且,和深度學(xué)習(xí)之父Geoffrey Hinton一樣,劉嘉教授深耕心理學(xué)、腦科學(xué)與人工智能交匯領(lǐng)域。他在混沌多次授課,足夠底層,足夠系統(tǒng),跨學(xué)科的認(rèn)知和精彩的表達(dá),每次都給同學(xué)帶來新的啟發(fā)。
劉嘉老師說:“當(dāng)前,我們有幸在人生中經(jīng)歷這樣一個(gè)范式轉(zhuǎn)換的時(shí)刻,它不僅簡單的是一個(gè)軟件給你帶來便利,而是讓你感受到文明的更迭,并且成為其中一部分的動(dòng)力之所在。”
01
人類皇冠上的最后一顆明珠,我們?nèi)祟愖詈蟮淖饑?yán)就集中在這一區(qū)域,也就是我們稱之為AGI所在的地方。它的展現(xiàn)其實(shí)非常簡單,可以跟朋友聊天、帶家人去海邊玩,開車四處游蕩等等,這就是我們每個(gè)人每天做的事情,看上去平平無奇,但它有兩個(gè)非常了不起的特點(diǎn)。
第一個(gè)特點(diǎn)是“任務(wù)的切換”。你和同事開會(huì)時(shí)所采用的任務(wù)策略和帶家人去旅游所用的策略是完全不同的,所以說策略需要?jiǎng)討B(tài)的調(diào)整。
第二個(gè)特點(diǎn)是“環(huán)境”。當(dāng)你在星巴克喝咖啡與在足球場踢球時(shí),所處的環(huán)境也是完全不同的。
這就是AGI所觸碰的領(lǐng)域,它是在開放環(huán)境里的動(dòng)態(tài)策略。
02
我們梳理AGI的演化:
第一階段,以ChatGPT為代表的大語言模型,問它問題,它告訴我們答案,然后我們?nèi)バ袆?dòng);
第二階段,以ChatGPT為代表的大語言模型 + Autonomous Agents,我們不僅可以問它問題,還能讓它去執(zhí)行任務(wù);
第三階段,以ChatGPT為代表的大語言模型+ Generative Agents,我們不再具體告訴它干什么,而是告訴它我們的目標(biāo)。
03
自主代理(Autonomous Agency),它不同于傳統(tǒng)的AI,自主代理通過分析感知數(shù)據(jù),獨(dú)立思考,然后調(diào)用工具去實(shí)現(xiàn)對(duì)通用問題的自動(dòng)化處理。簡單點(diǎn)來說,就是給我們的ChatGPT或者GPT4等等裝上感知和行動(dòng),讓它變成了一個(gè)完整的人,不僅擁有大腦,也擁有四肢。
那么這時(shí)候,我們的AGI由“問它問題,它告訴我們答案,然后我們?nèi)バ袆?dòng)”的ChatGPT模式轉(zhuǎn)變?yōu)榱恕安粌H可以問它問題,還能讓它執(zhí)行任務(wù)”的ChatGPT + Autonomous Agents。
舉一個(gè)簡單的例子。一個(gè)人要出門,問今天要下雨嗎,ChatGPT的感知系統(tǒng)聽到了這句話,就去上網(wǎng)搜索今天的天氣預(yù)報(bào),并根據(jù)它的歷史知識(shí)來規(guī)劃不同的雨應(yīng)該帶什么樣的東西,最后它的判斷為今天要下中雨,應(yīng)該準(zhǔn)備一把傘,然后就給它的動(dòng)作下一個(gè)指令,把傘送給主人。
我們只是給了它一個(gè)需求,它就把剩下所有的事情幫我們干完,這就是我們現(xiàn)在所說的AGI的“先思而后行”。
04
我認(rèn)為一個(gè)真正的Agent(代理/智能體)是不再具體告訴它要做什么,而是告訴它一個(gè)目標(biāo)。這是下一代的Agent,我稱之為“生成式Agent”(Generative Agents)。
生成式Agent不僅可以自主完成任務(wù),而且是擁有欲望、信念、意圖以及采取行動(dòng)能力的智能實(shí)體。
它應(yīng)該具有哪些特點(diǎn)?我們可以從三個(gè)維度理解:
1、它要有多種的技能。
2、它能夠處理各種各樣的情況。
3、它必須和世界產(chǎn)生真實(shí)的交互。
05
也就是說,作為一個(gè)智能體,它需要具備技能、和現(xiàn)實(shí)交互的能力、以及具身智能(Embodiment)。
在個(gè)體產(chǎn)生后,我們需要做的是Agent和Agent之間的交互、Agent和人之間的交互。我們可以構(gòu)建一個(gè)虛擬的場景,在這個(gè)虛擬的場景里放入機(jī)器人,也可以將真正的人放進(jìn)去,通過AR、VR技術(shù)連接互動(dòng),形成一個(gè)群體的智能。
這時(shí)候會(huì)產(chǎn)生一個(gè)問題,當(dāng)群體智能形成的時(shí)候,大家有合作、有爭吵、也有競爭,這時(shí)候就會(huì)產(chǎn)生復(fù)雜的博弈,在復(fù)雜的博弈里就會(huì)產(chǎn)生一個(gè)非常重要的概念——我。當(dāng)你一個(gè)人的時(shí)候,你不需要“我”這個(gè)概念,因?yàn)槲揖褪且磺?;但是?dāng)你站在一群人里的時(shí)候,一定要分清我和其他人是不一樣的。
產(chǎn)生“我”這個(gè)概念后,就會(huì)出現(xiàn)意識(shí)。那我們就進(jìn)入了一個(gè)全新的智能階段。
06
如果說ChatGPT只是讓我們看到了AGI的一絲火花,讓我們?cè)诤诎抵锌吹搅死杳鞯氖锕猓?/p>
那么生成式Agent的加持則將AGI從第二階段的領(lǐng)域模型變成第三階段的認(rèn)知模型,這時(shí)候才是一個(gè)真正的AGI。
我們看一下智能的三層次模型:
第一個(gè)層次,我們稱之為任務(wù)模型,它能完成特定的任務(wù),就像面孔識(shí)別、文字識(shí)別,這種任務(wù)特異的AI。如果一旦離開它所專注的某一個(gè)任務(wù),它就會(huì)變成“人工智障”。
第二個(gè)層次,叫做領(lǐng)域模型,它是能夠完成某個(gè)特定領(lǐng)域的工作,比如說教師。因?yàn)镃hatGPT的出現(xiàn),我們智能模型開始從TSAI轉(zhuǎn)向了領(lǐng)域模型,它帶來的不僅僅是效率的提升,更是一種范式的轉(zhuǎn)變。
第三個(gè)層次,認(rèn)知模型。說起來很簡單,認(rèn)知模型就是能看、能聽、能思考、能規(guī)劃,也就是說,當(dāng)它真正實(shí)現(xiàn)類人化,這才是真正的AGI。
07
我們即將創(chuàng)造出與人類相似的一個(gè)全新的物種,它不再停留在計(jì)算機(jī)機(jī)房里,而是出現(xiàn)在你散步的大街上。
這個(gè)時(shí)候,我們希望它具有什么樣的能力呢?
我特別喜歡的一幅圖,西班牙的斗牛場上,感到身體不適的斗牛士,他靠在場邊,而第一個(gè)趕來的,來救助他的,是渾身插滿了劍的這頭牛。這頭牛沒有攻擊,而是默默地看著他。這時(shí)候我們能看到一種感性的成分,一種善良的成分在里面,而這種善良的成分必須要通過另外一種途徑來做到,怎么做到呢?
我們先來看如何構(gòu)造一個(gè)人。

在人的大腦里,最底層的腦干是呼吸的中樞,往上面走是小腦,他是讓我們能夠行走的一部分;再往上面走是丘腦,它能夠感知外界;再往上面走是邊緣系統(tǒng),它能產(chǎn)生情緒、情感,作出一些簡單的判斷。
最上面則是在過去300萬年里人類進(jìn)化明顯的地方——大腦皮層,它的體積增加了3倍,與人類的自由意志、復(fù)雜判斷和符號(hào)思維有關(guān)。這一部分我們把它稱為理性,下面一部分我們把它稱為感性。
08
現(xiàn)在的大語言模型學(xué)習(xí)的正是人類的理性,但它并沒有觸達(dá)人類的感性。
我們現(xiàn)在僅僅有科學(xué)的尺度,但是沒有情感的溫度。因此,接下來的工作是讓大模型獲得情感的溫度。
感性擁有兩個(gè)特征:
第一個(gè)特征是“身臨”。我相信,就算我們看了很多旅游風(fēng)光片、紀(jì)錄片,仍然想要親自去到那個(gè)地方,因?yàn)橹挥猩砼R其境,才會(huì)有真實(shí)的感受。
第二個(gè)特征是“體驗(yàn)”。如果你假設(shè)你身處金門大橋腦袋卻充斥著工作內(nèi)容,是不會(huì)有強(qiáng)烈的體驗(yàn)感的,因此只有沉浸其中,才會(huì)有感性產(chǎn)生。
正如出身中產(chǎn)的切·格瓦拉只有在獨(dú)自騎行、經(jīng)歷寒冷的夜晚之時(shí),才會(huì)說出“那是我經(jīng)歷的最冷的一晚,但那一晚也讓我稍稍靠近了人類?!?/p>
與此類比,現(xiàn)在的大語言模型滿腹經(jīng)綸,但還僅僅停留在機(jī)房里面,它沒有真正邁入世界。
09
而當(dāng)智能體一旦擁有意識(shí)之后,它就會(huì)按照自我的觀念快速發(fā)展,這時(shí)我們就可能會(huì)面臨一個(gè)奇點(diǎn),文明的載體也不再以人為單位運(yùn)行,而是以AGI的方式運(yùn)行。
因此,我把這個(gè)奇點(diǎn)來臨的時(shí)刻稱為“人類歷史上的第二次認(rèn)知革命”。
我們經(jīng)常談到認(rèn)知革命,其實(shí)它們都不配。為什么?因?yàn)榈谝淮握J(rèn)知革命使得我們的祖先成為萬物之靈,人類成為世界的主宰。而第二次認(rèn)知革命,就是人類創(chuàng)造出了一個(gè)全新的物種。
這天來臨的時(shí)刻,文明的火炬就要由我們?nèi)祟悅鞯紸GI的手中。
10
在我們都可以見證的未來,AGI會(huì)超越人類的智能,而且是永遠(yuǎn)不回頭的超越。
當(dāng)然這也帶來一個(gè)很大的問題,我們將面臨一個(gè)新物種的挑戰(zhàn),可能會(huì)帶來世界的毀滅,我們必須要像對(duì)待疾病一樣來應(yīng)對(duì)這件事情。
那么對(duì)于我們而言,未來該怎么辦?
有三種可能:
第一,Autonomous Agency特別友好,讓干什么就干什么,不知疲勞,就像《星球大戰(zhàn)》的R2-D2一樣,可以做所有我們交給它的任務(wù);
第二,人機(jī)合一是最好的結(jié)局,在座各位都有脆弱的身體,我們可以把思想、記憶、情感上傳到數(shù)字大腦里面,這樣由此獲得永生;
第三,AI可能會(huì)把我們干掉,就像我們把尼安德特人干掉一樣。
無論是R2-D2,無論是永生還是人類最終的消亡,這與大家都有密切的關(guān)系,值得每個(gè)人去思考,不僅僅是商業(yè)的機(jī)會(huì),還包含人類的未來。
我特別喜歡Sam Altman那句話:世界將發(fā)生翻天覆地變化。我們正處于巨變的開端,人類有一個(gè)難能可貴的機(jī)會(huì)去打造未來。
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問,請(qǐng)聯(lián)系editor@cyzone.cn。







