關(guān)于AGI 和人類的未來，你一定要看看清華劉嘉教授的10 個(gè)觀點(diǎn)

混沌學(xué)園·2025-10-27

10 個(gè)觀點(diǎn)

本文來自微信公眾號(hào) “混沌大學(xué)”（ID：hundun-university），作者：混沌學(xué)園，36氪經(jīng)授權(quán)發(fā)布。

編者按：本文來自微信公眾號(hào) 光錐智能（ID：guangzhui-tech），作者：魏琳華，編輯：王一粟，創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。

為什么推薦你看看劉嘉老師的觀點(diǎn)？

劉嘉老師是清華大學(xué)心理與認(rèn)知科學(xué)系主任、清華大學(xué)基礎(chǔ)科學(xué)講席教授、智源人工智能研究院首席科學(xué)家。

而且，和深度學(xué)習(xí)之父Geoffrey Hinton一樣，劉嘉教授深耕心理學(xué)、腦科學(xué)與人工智能交匯領(lǐng)域。他在混沌多次授課，足夠底層，足夠系統(tǒng)，跨學(xué)科的認(rèn)知和精彩的表達(dá)，每次都給同學(xué)帶來新的啟發(fā)。

劉嘉老師說：“當(dāng)前，我們有幸在人生中經(jīng)歷這樣一個(gè)范式轉(zhuǎn)換的時(shí)刻，它不僅簡單的是一個(gè)軟件給你帶來便利，而是讓你感受到文明的更迭，并且成為其中一部分的動(dòng)力之所在。”

01

人類皇冠上的最后一顆明珠，我們?nèi)祟愖詈蟮淖饑?yán)就集中在這一區(qū)域，也就是我們稱之為AGI所在的地方。它的展現(xiàn)其實(shí)非常簡單，可以跟朋友聊天、帶家人去海邊玩，開車四處游蕩等等，這就是我們每個(gè)人每天做的事情，看上去平平無奇，但它有兩個(gè)非常了不起的特點(diǎn)。

第一個(gè)特點(diǎn)是“任務(wù)的切換”。你和同事開會(huì)時(shí)所采用的任務(wù)策略和帶家人去旅游所用的策略是完全不同的，所以說策略需要?jiǎng)討B(tài)的調(diào)整。

第二個(gè)特點(diǎn)是“環(huán)境”。當(dāng)你在星巴克喝咖啡與在足球場踢球時(shí)，所處的環(huán)境也是完全不同的。

這就是AGI所觸碰的領(lǐng)域，它是在開放環(huán)境里的動(dòng)態(tài)策略。

02

我們梳理AGI的演化：

第一階段，以ChatGPT為代表的大語言模型，問它問題，它告訴我們答案，然后我們?nèi)バ袆?dòng)；

第二階段，以ChatGPT為代表的大語言模型 + Autonomous Agents，我們不僅可以問它問題，還能讓它去執(zhí)行任務(wù)；

第三階段，以ChatGPT為代表的大語言模型+ Generative Agents，我們不再具體告訴它干什么，而是告訴它我們的目標(biāo)。

03

自主代理（Autonomous Agency），它不同于傳統(tǒng)的AI，自主代理通過分析感知數(shù)據(jù)，獨(dú)立思考，然后調(diào)用工具去實(shí)現(xiàn)對(duì)通用問題的自動(dòng)化處理。簡單點(diǎn)來說，就是給我們的ChatGPT或者GPT4等等裝上感知和行動(dòng)，讓它變成了一個(gè)完整的人，不僅擁有大腦，也擁有四肢。

那么這時(shí)候，我們的AGI由“問它問題，它告訴我們答案，然后我們?nèi)バ袆?dòng)”的ChatGPT模式轉(zhuǎn)變?yōu)榱恕安粌H可以問它問題，還能讓它執(zhí)行任務(wù)”的ChatGPT + Autonomous Agents。

舉一個(gè)簡單的例子。一個(gè)人要出門，問今天要下雨嗎，ChatGPT的感知系統(tǒng)聽到了這句話，就去上網(wǎng)搜索今天的天氣預(yù)報(bào)，并根據(jù)它的歷史知識(shí)來規(guī)劃不同的雨應(yīng)該帶什么樣的東西，最后它的判斷為今天要下中雨，應(yīng)該準(zhǔn)備一把傘，然后就給它的動(dòng)作下一個(gè)指令，把傘送給主人。

我們只是給了它一個(gè)需求，它就把剩下所有的事情幫我們干完，這就是我們現(xiàn)在所說的AGI的“先思而后行”。

04

我認(rèn)為一個(gè)真正的Agent（代理/智能體）是不再具體告訴它要做什么，而是告訴它一個(gè)目標(biāo)。這是下一代的Agent，我稱之為“生成式Agent”（Generative Agents）。

生成式Agent不僅可以自主完成任務(wù)，而且是擁有欲望、信念、意圖以及采取行動(dòng)能力的智能實(shí)體。

它應(yīng)該具有哪些特點(diǎn)？我們可以從三個(gè)維度理解：

1、它要有多種的技能。

2、它能夠處理各種各樣的情況。

3、它必須和世界產(chǎn)生真實(shí)的交互。

05

也就是說，作為一個(gè)智能體，它需要具備技能、和現(xiàn)實(shí)交互的能力、以及具身智能（Embodiment）。

在個(gè)體產(chǎn)生后，我們需要做的是Agent和Agent之間的交互、Agent和人之間的交互。我們可以構(gòu)建一個(gè)虛擬的場景，在這個(gè)虛擬的場景里放入機(jī)器人，也可以將真正的人放進(jìn)去，通過AR、VR技術(shù)連接互動(dòng)，形成一個(gè)群體的智能。

這時(shí)候會(huì)產(chǎn)生一個(gè)問題，當(dāng)群體智能形成的時(shí)候，大家有合作、有爭吵、也有競爭，這時(shí)候就會(huì)產(chǎn)生復(fù)雜的博弈，在復(fù)雜的博弈里就會(huì)產(chǎn)生一個(gè)非常重要的概念——我。當(dāng)你一個(gè)人的時(shí)候，你不需要“我”這個(gè)概念，因?yàn)槲揖褪且磺?；但是?dāng)你站在一群人里的時(shí)候，一定要分清我和其他人是不一樣的。

產(chǎn)生“我”這個(gè)概念后，就會(huì)出現(xiàn)意識(shí)。那我們就進(jìn)入了一個(gè)全新的智能階段。

06

如果說ChatGPT只是讓我們看到了AGI的一絲火花，讓我們?cè)诤诎抵锌吹搅死杳鞯氖锕猓?/p>

那么生成式Agent的加持則將AGI從第二階段的領(lǐng)域模型變成第三階段的認(rèn)知模型，這時(shí)候才是一個(gè)真正的AGI。

我們看一下智能的三層次模型：

第一個(gè)層次，我們稱之為任務(wù)模型，它能完成特定的任務(wù)，就像面孔識(shí)別、文字識(shí)別，這種任務(wù)特異的AI。如果一旦離開它所專注的某一個(gè)任務(wù)，它就會(huì)變成“人工智障”。

第二個(gè)層次，叫做領(lǐng)域模型，它是能夠完成某個(gè)特定領(lǐng)域的工作，比如說教師。因?yàn)镃hatGPT的出現(xiàn)，我們智能模型開始從TSAI轉(zhuǎn)向了領(lǐng)域模型，它帶來的不僅僅是效率的提升，更是一種范式的轉(zhuǎn)變。

第三個(gè)層次，認(rèn)知模型。說起來很簡單，認(rèn)知模型就是能看、能聽、能思考、能規(guī)劃，也就是說，當(dāng)它真正實(shí)現(xiàn)類人化，這才是真正的AGI。

07

我們即將創(chuàng)造出與人類相似的一個(gè)全新的物種，它不再停留在計(jì)算機(jī)機(jī)房里，而是出現(xiàn)在你散步的大街上。

這個(gè)時(shí)候，我們希望它具有什么樣的能力呢？

我特別喜歡的一幅圖，西班牙的斗牛場上，感到身體不適的斗牛士，他靠在場邊，而第一個(gè)趕來的，來救助他的，是渾身插滿了劍的這頭牛。這頭牛沒有攻擊，而是默默地看著他。這時(shí)候我們能看到一種感性的成分，一種善良的成分在里面，而這種善良的成分必須要通過另外一種途徑來做到，怎么做到呢？

我們先來看如何構(gòu)造一個(gè)人。

在人的大腦里，最底層的腦干是呼吸的中樞，往上面走是小腦，他是讓我們能夠行走的一部分；再往上面走是丘腦，它能夠感知外界；再往上面走是邊緣系統(tǒng)，它能產(chǎn)生情緒、情感，作出一些簡單的判斷。

最上面則是在過去300萬年里人類進(jìn)化明顯的地方——大腦皮層，它的體積增加了3倍，與人類的自由意志、復(fù)雜判斷和符號(hào)思維有關(guān)。這一部分我們把它稱為理性，下面一部分我們把它稱為感性。

08

現(xiàn)在的大語言模型學(xué)習(xí)的正是人類的理性，但它并沒有觸達(dá)人類的感性。

我們現(xiàn)在僅僅有科學(xué)的尺度，但是沒有情感的溫度。因此，接下來的工作是讓大模型獲得情感的溫度。

感性擁有兩個(gè)特征：

第一個(gè)特征是“身臨”。我相信，就算我們看了很多旅游風(fēng)光片、紀(jì)錄片，仍然想要親自去到那個(gè)地方，因?yàn)橹挥猩砼R其境，才會(huì)有真實(shí)的感受。

第二個(gè)特征是“體驗(yàn)”。如果你假設(shè)你身處金門大橋腦袋卻充斥著工作內(nèi)容，是不會(huì)有強(qiáng)烈的體驗(yàn)感的，因此只有沉浸其中，才會(huì)有感性產(chǎn)生。

正如出身中產(chǎn)的切·格瓦拉只有在獨(dú)自騎行、經(jīng)歷寒冷的夜晚之時(shí)，才會(huì)說出“那是我經(jīng)歷的最冷的一晚，但那一晚也讓我稍稍靠近了人類?！?/p>

與此類比，現(xiàn)在的大語言模型滿腹經(jīng)綸，但還僅僅停留在機(jī)房里面，它沒有真正邁入世界。

09

而當(dāng)智能體一旦擁有意識(shí)之后，它就會(huì)按照自我的觀念快速發(fā)展，這時(shí)我們就可能會(huì)面臨一個(gè)奇點(diǎn)，文明的載體也不再以人為單位運(yùn)行，而是以AGI的方式運(yùn)行。

因此，我把這個(gè)奇點(diǎn)來臨的時(shí)刻稱為“人類歷史上的第二次認(rèn)知革命”。

我們經(jīng)常談到認(rèn)知革命，其實(shí)它們都不配。為什么？因?yàn)榈谝淮握J(rèn)知革命使得我們的祖先成為萬物之靈，人類成為世界的主宰。而第二次認(rèn)知革命，就是人類創(chuàng)造出了一個(gè)全新的物種。

這天來臨的時(shí)刻，文明的火炬就要由我們?nèi)祟悅鞯紸GI的手中。

10

在我們都可以見證的未來，AGI會(huì)超越人類的智能，而且是永遠(yuǎn)不回頭的超越。

當(dāng)然這也帶來一個(gè)很大的問題，我們將面臨一個(gè)新物種的挑戰(zhàn)，可能會(huì)帶來世界的毀滅，我們必須要像對(duì)待疾病一樣來應(yīng)對(duì)這件事情。

那么對(duì)于我們而言，未來該怎么辦？

有三種可能：

第一，Autonomous Agency特別友好，讓干什么就干什么，不知疲勞，就像《星球大戰(zhàn)》的R2-D2一樣，可以做所有我們交給它的任務(wù)；

第二，人機(jī)合一是最好的結(jié)局，在座各位都有脆弱的身體，我們可以把思想、記憶、情感上傳到數(shù)字大腦里面，這樣由此獲得永生；

第三，AI可能會(huì)把我們干掉，就像我們把尼安德特人干掉一樣。

無論是R2-D2，無論是永生還是人類最終的消亡，這與大家都有密切的關(guān)系，值得每個(gè)人去思考，不僅僅是商業(yè)的機(jī)會(huì)，還包含人類的未來。

我特別喜歡Sam Altman那句話：世界將發(fā)生翻天覆地變化。我們正處于巨變的開端，人類有一個(gè)難能可貴的機(jī)會(huì)去打造未來。

本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表，版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn)，不代表創(chuàng)業(yè)邦立場，轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問，請(qǐng)聯(lián)系editor@cyzone.cn。