編者按:本文來(lái)自微信公眾號(hào)“混沌大學(xué)”(ID:hundun-university),作者:混沌學(xué)園,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
在這個(gè)AI技術(shù)日新月異的時(shí)代,我們眼看著它不僅在改變生活,更在改變著商業(yè)規(guī)則。
AI可不只是那些冰冷的算法,它現(xiàn)在能像人一樣思考、推理,甚至在某些方面的表現(xiàn)超越了普通人。這告訴我們,傳統(tǒng)的技術(shù)和創(chuàng)新模式已經(jīng)不夠用了,企業(yè)要想增長(zhǎng)、要保持競(jìng)爭(zhēng)力,就需要換個(gè)思路。AI正在重新定義我們理解和實(shí)踐商業(yè)創(chuàng)新的方式。
最近,混沌君旁聽(tīng)了混沌學(xué)園的創(chuàng)始人李善友教授的重磅全新課程《認(rèn)知型創(chuàng)新:從OpenAI到DeepSeek》。
這門(mén)課從企業(yè)創(chuàng)新的角度,講述了全球兩大頂尖AI公司——OpenAI和DeepSeek是如何一步步走到今天的,他們究竟走過(guò)了怎樣的創(chuàng)新之路。這對(duì)于我們理解AI時(shí)代的技術(shù)創(chuàng)新和企業(yè)創(chuàng)新,提供了清晰且極具價(jià)值的路徑。
教授深挖了OpenAI最初的愿景和它如何對(duì)抗巨頭的思路,解密大語(yǔ)言模型是如何誕生的,尤其是AI能力如何從簡(jiǎn)單積累到驚人“涌現(xiàn)”。還解讀了DeepSeek如何在資源有限的情況下,走出一條“低成本高性能”的獨(dú)特道路;更探討了AI時(shí)代下,企業(yè)應(yīng)該怎樣構(gòu)建一個(gè)能不斷“涌現(xiàn)”創(chuàng)新的組織模式,走向“技術(shù)領(lǐng)先”。
第一幕:OpenAI的橫空出世
OpenAI的創(chuàng)立初心:反巨頭霸權(quán)
OpenAI的故事得從2015年說(shuō)起。那時(shí)候,埃隆·馬斯克和薩姆·奧特曼就開(kāi)始擔(dān)憂:AI這種未來(lái)世界的“終極武器”,若落到少數(shù)科技巨頭手里,對(duì)全人類將是巨大麻煩。馬斯克親歷了谷歌收購(gòu)DeepMind,深感AI力量集中的風(fēng)險(xiǎn),于是他決定和奧特曼一起干件大事——成立OpenAI。
他們的初心是要搞一個(gè)開(kāi)源、安全、普惠的人工智能。與其讓幾家大公司“圈地為王”,不如讓AI技術(shù)像陽(yáng)光空氣一樣,普照給所有人。為此,他們不惜代價(jià)從谷歌挖來(lái)核心科學(xué)家伊利亞·蘇茨克維爾(Ilya Sutskever)。據(jù)傳,就因?yàn)橥谧咭晾麃嗊@事兒,馬斯克跟谷歌創(chuàng)始人之間的友誼都斷了。

圖為伊利亞·蘇茨克維爾(Ilya Sutskever)
OpenAI于是就帶著“反巨頭”使命誕生,最初是非盈利組織,為保證AI純粹與開(kāi)放。他們吸引頂尖科學(xué)家,共同探索通用人工智能(AGI)的可能性。
大語(yǔ)言模型的誕生邏輯:Transformer × Scaling Law
OpenAI能引爆大語(yǔ)言模型革命,并非偶然,而是源于對(duì)兩大“秘密武器”的極致運(yùn)用:Transformer架構(gòu)和Scaling Law(尺度定律)。
先說(shuō)Transformer。這是谷歌在2017年搞出來(lái)的,當(dāng)時(shí)它像個(gè)低調(diào)“技術(shù)極客”,沒(méi)人預(yù)料到它的巨大能量。打個(gè)比方,以前處理語(yǔ)言信息的模型,像“近視眼”,難以高效處理長(zhǎng)文本。而Transformer引入“自注意力機(jī)制”,讓模型處理每個(gè)詞時(shí),能“一眼掃盡”整個(gè)句子所有其他詞,并判斷詞與詞之間關(guān)系。這就像給模型裝上“超廣角透視眼”,其語(yǔ)言理解能力瞬間飆升,實(shí)現(xiàn)數(shù)據(jù)并行處理,訓(xùn)練速度大大提高,為大語(yǔ)言模型高速發(fā)展奠定基礎(chǔ)。

Transformer架構(gòu)介紹,圖源自網(wǎng)絡(luò)
緊接著,是真正讓“大模型”概念深入人心的Scaling Law(尺度定律)。這項(xiàng)定律揭示了一個(gè)規(guī)律:大語(yǔ)言模型性能提升,并非玄學(xué),而與模型規(guī)模(參數(shù)量)、訓(xùn)練數(shù)據(jù)量及計(jì)算資源投入之間,存在可預(yù)測(cè)的、幾乎線性的關(guān)系。這意味著,只要持續(xù)投入更多計(jì)算資源,用更大模型、更多數(shù)據(jù)訓(xùn)練,模型性能就會(huì)穩(wěn)步提升,甚至“涌現(xiàn)”出未曾預(yù)料的新能力。
只要算力足夠大,數(shù)據(jù)足夠多,神經(jīng)網(wǎng)絡(luò)就一定可以超越人類設(shè)計(jì)。這個(gè)思維影響了伊利亞。
OpenAI正是憑借對(duì)Scaling Law的“篤信”和伊利亞等人的堅(jiān)決執(zhí)行,才敢于進(jìn)行前所未有的巨額投入,最終催生了震驚世界的顛覆性大語(yǔ)言模型??梢哉f(shuō),Scaling Law不僅是科學(xué)發(fā)現(xiàn),更是指引AI前進(jìn)的“信仰”。
從MP神經(jīng)元到GPT的“涌現(xiàn)”之路
人類對(duì)機(jī)器智能的探索,是漫長(zhǎng)而驚喜的旅程。早在上世紀(jì)40年代,科學(xué)家們就琢磨人腦思考方式,搞出了像MP神經(jīng)元模型這樣的早期理論,它像簡(jiǎn)陋的“電子腦細(xì)胞”,是構(gòu)建人工神經(jīng)網(wǎng)絡(luò)的初步嘗試。這些最初的嘗試,雖笨拙,卻為后來(lái)深度學(xué)習(xí)的參天大樹(shù)打下根基。
而當(dāng)代的GPT(Generative Pre-trained Transformer)系列模型,是這條演進(jìn)鏈上的最新奇跡。它們之所以轟動(dòng),核心在于一個(gè)神奇能力:“涌現(xiàn)”。這詞兒聽(tīng)起來(lái)有點(diǎn)哲學(xué),但很好理解。你可以想象,單個(gè)水分子沒(méi)有“濕潤(rùn)”屬性,但無(wú)數(shù)水分子聚集成河流,便能滋養(yǎng)萬(wàn)物——這就是“涌現(xiàn)”。
在GPT模型里,當(dāng)參數(shù)量(模型“神經(jīng)元”數(shù)量)和訓(xùn)練數(shù)據(jù)量達(dá)到巨大臨界點(diǎn)時(shí),這些模型就像突然“開(kāi)了竅”,能力瞬間爆發(fā),展現(xiàn)出單個(gè)部分不具備、甚至連科學(xué)家都難以預(yù)測(cè)的新功能。
這些能力并非預(yù)先編程設(shè)定,而是在海量訓(xùn)練中自發(fā)學(xué)習(xí)和領(lǐng)悟。這種“涌現(xiàn)”現(xiàn)象,使得大語(yǔ)言模型不再是只會(huì)“鸚鵡學(xué)舌”的工具,它們開(kāi)始具備“智能”,成為可與人類協(xié)作的通用型助手。
ChatGPT的爆火與人機(jī)交互范式變革
如果說(shuō)GPT模型誕生是AI技術(shù)大爆炸,那么2022年末OpenAI推出的ChatGPT爆火,則是一場(chǎng)真正意義上的全球“現(xiàn)象級(jí)”事件。
以前的AI工具,用起來(lái)很麻煩,你得學(xué)它的“行話”,敲特定指令。但ChatGPT不一樣,你用最日常、最自然的口語(yǔ)輸入,它就能理解你的意思,提供你想要的答案。無(wú)論是幫你寫(xiě)郵件、生成文案、解答科學(xué)問(wèn)題,甚至是調(diào)試代碼,ChatGPT都能給出令人驚艷的回答,有求必應(yīng)。
所以,ChatGPT的“火”,絕不僅僅是技術(shù)厲害,它更深刻地引發(fā)了人機(jī)交互范式根本性變革。以前,我們與機(jī)器交流僵硬、刻板。但ChatGPT開(kāi)啟“對(duì)話式AI”時(shí)代。它讓用戶不再需要學(xué)習(xí)枯燥編程語(yǔ)言或復(fù)雜指令,而是可以像聊天一樣,用最自然、最日常語(yǔ)言提問(wèn),AI就能理解并給出有意義、有邏輯的回復(fù)。
這極大降低了AI使用門(mén)檻,讓曾經(jīng)高高在上的技術(shù),真正走入千家萬(wàn)戶,深刻改變著人們的工作、學(xué)習(xí)和生活方式。
可以說(shuō),ChatGPT的成功,不僅為后續(xù)AI應(yīng)用大爆發(fā)奠定用戶基礎(chǔ),更重塑了我們對(duì)人機(jī)協(xié)作可能性邊界的認(rèn)知,讓我們看到了無(wú)限可能的未來(lái)。
推理模型o1的登場(chǎng):從系統(tǒng)1到系統(tǒng)2的認(rèn)知躍遷
在ChatGPT掀起普及狂潮后,OpenAI并未止步,繼續(xù)將目光投向更深層次智能——于是,迎來(lái)推理模型o1的登場(chǎng)。o1的出現(xiàn),標(biāo)志著人工智能認(rèn)知能力的重要躍遷,它將AI思考模式從“系統(tǒng)1”推向“系統(tǒng)2”。
這個(gè)“雙系統(tǒng)理論”源自心理學(xué)家丹尼爾·卡尼曼的《思考,快與慢》:系統(tǒng)1代表人類的直覺(jué)思維:快速、自動(dòng)化、不費(fèi)力。如看到2+2立刻得出4。
早期AI模型多體現(xiàn)“系統(tǒng)1”特征,擅長(zhǎng)模式識(shí)別,但缺乏深度邏輯推演。系統(tǒng)2代表人類的理性思維:緩慢、有意識(shí)、需投入精力。如解決復(fù)雜數(shù)學(xué)題、深入邏輯分析。
OpenAI的推理模型o1,正是朝著AI具備“系統(tǒng)2”能力方向邁進(jìn)。它不再僅依賴海量數(shù)據(jù)模式匹配,而是能進(jìn)行更復(fù)雜的多步推理、邏輯分析和深度問(wèn)題解決。甚至在推理中自我糾正。這種能力提升,使AI展現(xiàn)出更接近人類高級(jí)認(rèn)知功能的理解、分析和推理能力。
第二幕:DeepSeek的逆襲戰(zhàn)略
“有限Scaling Law”:低成本高性能路線
在全球AI巨頭大舉投入、追求極致Scaling Law時(shí),中國(guó)DeepSeek卻走出截然不同的逆襲之路——他們玩兒的是“有限Scaling Law”,成功實(shí)踐了低成本高性能戰(zhàn)略。
這并非否定規(guī)模力量,而是在資源有限現(xiàn)實(shí)下,玩兒出效率最大化的智慧。
DeepSeek團(tuán)隊(duì)清楚,并非所有公司都像OpenAI那樣擁有無(wú)限算力與資金。所以,他們目標(biāo)明確:如何在更“經(jīng)濟(jì)”的投入下,達(dá)到甚至超越頂尖模型性能?
他們不光投入少,更重要的是“會(huì)玩兒”。
“有限Scaling Law”的核心,在于對(duì)模型架構(gòu)和訓(xùn)練方法深度優(yōu)化。他們更側(cè)重?cái)?shù)據(jù)高質(zhì)量篩選與利用,而非盲目堆砌;更注重訓(xùn)練算法效率和收斂速度,而非簡(jiǎn)單延長(zhǎng)訓(xùn)練時(shí)間;更關(guān)注模型推理階段性能和能耗比,而非僅追求訓(xùn)練階段的峰值數(shù)據(jù)。
有個(gè)小細(xì)節(jié)特別能體現(xiàn)他們的理念。DeepSeek CEO梁文鋒常對(duì)團(tuán)隊(duì)說(shuō):“這行代碼,能不能省五毛錢(qián)的電費(fèi)?”
你想想,這種摳細(xì)節(jié)、追求極致效率精神,是不是跟那種“只要有錢(qián),大力出奇跡”的無(wú)限游戲完全不同?
最終,DeepSeek的R1模型以極低訓(xùn)練成本,展現(xiàn)出與OpenAI o1模型媲美的強(qiáng)大能力,甚至在某些指標(biāo)上有所超越。
這無(wú)疑是對(duì)“有錢(qián)就能贏”單一路徑的有力回應(yīng),證明創(chuàng)新在資源受限時(shí),同樣可迸發(fā)出驚人的能量。這個(gè)戰(zhàn)略選擇,也讓更多中小型企業(yè)和研究機(jī)構(gòu)看到參與大模型競(jìng)爭(zhēng)的可能性。
架構(gòu)創(chuàng)新:MLA + MoE 的軟硬協(xié)同優(yōu)化
DeepSeek能在有限成本下跑出高性能,除了理念上的“有限Scaling Law”,還得靠他們家在模型“骨架”上的大膽創(chuàng)新和軟硬件的配合。這其中,MLA(Multi-Head Latent Attention 多頭潛在注意力)和MoE(Mixture of Experts,混合專家模型)是兩大秘密武器。
先說(shuō)MLA。Transformer架構(gòu)里的“自注意力機(jī)制”雖然厲害,但處理長(zhǎng)文本時(shí)特別“吃內(nèi)存”,就像你腦子一下子要記住一本書(shū)每一頁(yè)每一個(gè)字,特別占內(nèi)存。MLA技術(shù)就像給模型“大腦”安裝高效“索引系統(tǒng)”和“壓縮包”。它通過(guò)算法設(shè)計(jì),讓模型計(jì)算注意力時(shí)更高效利用內(nèi)存。
打個(gè)比方,傳統(tǒng)做法圖書(shū)館所有書(shū)都是大號(hào)精裝本,特占地方。MLA能把普通書(shū)壓縮成低精度的版本,只有關(guān)鍵工具書(shū)才精裝。這樣,模型處理長(zhǎng)文本時(shí),就不用把所有細(xì)節(jié)都精裝到內(nèi)存里,只需要提煉核心信息,于是節(jié)省內(nèi)存占用,效率大大提升。
再來(lái)說(shuō)說(shuō)MoE(混合專家模型)。這個(gè)不是他們?cè)瓌?chuàng),但DeepSeek把它用活了。
傳統(tǒng)模型訓(xùn)練,像培養(yǎng)“全能廚師”,什么菜都會(huì)做,訓(xùn)練難還特別貴。MoE思路完全不一樣,它把大模型拆分成多個(gè)專家子網(wǎng)絡(luò)。每個(gè)專家像只專注一道菜的“專業(yè)廚師”。當(dāng)新任務(wù)進(jìn)來(lái)時(shí),模型像智能領(lǐng)班,只把任務(wù)分配給最擅長(zhǎng)解決問(wèn)題的“專家”廚師,而不是所有廚師都瞎忙活。
這樣,每次計(jì)算時(shí),只有少數(shù)相關(guān)的“專家”被激活,顯著降低了模型的計(jì)算成本和推理延遲。就像餐館有256個(gè)廚子,你點(diǎn)麻辣烤魚(yú)和甜點(diǎn),只需激活川菜專家、海鮮廚師和甜點(diǎn)師三四個(gè),效率是不是高多了?
最關(guān)鍵的是,DeepSeek不光用了這些技術(shù),他們還實(shí)現(xiàn)了軟硬協(xié)同優(yōu)化。這可不是簡(jiǎn)單軟件優(yōu)化,而是模型架構(gòu)(軟件)和底層計(jì)算硬件(如華為昇騰AI平臺(tái))的深度配合。他們像軟件工程師和硬件工程師坐一桌,共同設(shè)計(jì)一套最匹配系統(tǒng),最大限度發(fā)揮計(jì)算資源潛力。這種從“軟件”到“硬件”的全棧優(yōu)化思路。這才是DeepSeek突破資源瓶頸,實(shí)現(xiàn)低成本高性能的真正原因。
就拿DeepSeek V3模型來(lái)說(shuō),它參數(shù)高達(dá)6710億,但每次計(jì)算只需激活37億參數(shù),這使得V3訓(xùn)練成本僅5557萬(wàn)美元——是同類型模型成本的十分之一。這種巨大的成本優(yōu)勢(shì),讓所有人都震驚了。
R1開(kāi)源,推動(dòng)全民AI認(rèn)知突破
如果說(shuō)DeepSeek V3模型讓他們業(yè)界嶄露頭角,那么真正讓DeepSeek名震天下的,是它在2025年1月20日發(fā)布的推理模型R1。V3相當(dāng)于基礎(chǔ)的歸納法,R1則是真正能“思考”的推理模型。
我們拿圍棋AlphaGo和AlphaGo Zero做個(gè)類比。AlphaGo打敗柯潔,因它背下人類圍棋幾千年棋譜,是在人類經(jīng)驗(yàn)上學(xué)下棋。AlphaGo Zero則不同,不輸入任何人類定式,只告知它基本規(guī)則,然后自己跟自己下棋,純強(qiáng)化學(xué)習(xí),“左手打右手”,把差的扔掉,好的繼續(xù)優(yōu)化。結(jié)果呢?AlphaGo Zero只訓(xùn)練三天,就完勝AlphaGo。
回到AI大模型,OpenAI的GPT模型,強(qiáng)化學(xué)習(xí)基于人類反饋(RLHF),就像剛開(kāi)始的AlphaGo。而DeepSeek的R1,像AlphaGo Zero,用無(wú)需人類反饋的純強(qiáng)化學(xué)習(xí),讓AI自己“試錯(cuò)”,好的留,差的扔,自己摸索最優(yōu)解。
令人震驚的是,OpenAI的推理模型o1雖率先實(shí)現(xiàn)類似能力,但它保密、不開(kāi)源、不寫(xiě)論文。然而,DeepSeek竟然成功復(fù)現(xiàn)了這種能力。這簡(jiǎn)直“驚天地泣鬼神”。
而且,R1模型在交互上,竟然還能展示完整推理過(guò)程。你問(wèn)問(wèn)題,它不僅給答案,還能把怎么一步步“思考”出來(lái)的過(guò)程展示給你。甚至有評(píng)論說(shuō),連奧特曼都對(duì)OpenAI o1不能展示完整推理過(guò)程感到后悔。
奧數(shù)競(jìng)賽中,DeepSeek R1和OpenAI o1準(zhǔn)確率幾乎不相上下,證明R1在純邏輯推理、數(shù)學(xué)和編程上的強(qiáng)大能力。
2025年1月26日,DeepSeek甚至登上美國(guó)免費(fèi)應(yīng)用榜單第一。微軟CEO公開(kāi)場(chǎng)合提DeepSeek,第二天英偉達(dá)市值就下跌17%!這足以說(shuō)明R1的出現(xiàn),對(duì)整個(gè)AI生態(tài)產(chǎn)生了巨大震動(dòng)。
劉嘉教授曾打比方:“這就像從尼安德特人到現(xiàn)代智人這么重要。” 它實(shí)現(xiàn)從歸納法到演繹法認(rèn)知躍遷,人類文明史上只有古希臘發(fā)生過(guò),才有了科學(xué)革命。
現(xiàn)在,AI正進(jìn)入此階段,R1,就是智能時(shí)代的“核武器”,目前只有中美兩國(guó)擁有。
AI時(shí)代組織的構(gòu)建:以“涌現(xiàn)”為關(guān)鍵詞的AI Lab范式
在AI浪潮沖擊下,傳統(tǒng)組織模式面臨重構(gòu)需求。DeepSeek則描繪了一種以“涌現(xiàn)”為關(guān)鍵詞的AI Lab范式,更能適應(yīng)AI時(shí)代創(chuàng)新節(jié)奏。
傳統(tǒng)的研發(fā)機(jī)構(gòu)往往層級(jí)分明,任務(wù)自上而下分配。但在AI大模型研發(fā)中,創(chuàng)新不可預(yù)測(cè),需要高度靈活性和自發(fā)性。DeepSeek AI Lab組織范式,正是為了激發(fā)這種“涌現(xiàn)”創(chuàng)新力。這種范式:
開(kāi)放協(xié)作與資源共享:DeepSeek允許研發(fā)資源(特別是寶貴的GPU算力)對(duì)全員開(kāi)放。研究人員可根據(jù)項(xiàng)目需求,自由調(diào)用計(jì)算資源,不受限于審批流程。這種高度資源共享,極大激發(fā)研究人員積極性、自主性,讓他們能更快速進(jìn)行實(shí)驗(yàn)和迭代。
動(dòng)態(tài)團(tuán)隊(duì)構(gòu)成:項(xiàng)目團(tuán)隊(duì)非固定,根據(jù)研究方向動(dòng)態(tài)調(diào)整。員工可根據(jù)興趣專長(zhǎng),自發(fā)成立小組,共同推進(jìn)特定項(xiàng)目。這種靈活團(tuán)隊(duì)模式,打破部門(mén)壁壘,促進(jìn)跨學(xué)科合作與知識(shí)流動(dòng)。
自組織管理:管理提供創(chuàng)新“涌現(xiàn)”環(huán)境,非簡(jiǎn)單命令控制。團(tuán)隊(duì)成員擁有自主權(quán)與責(zé)任感,主動(dòng)發(fā)現(xiàn)問(wèn)題,提出解決方案。管理者提供支持,掃清障礙,確保信息透明。梁文鋒本人就保持著極高專注力,他不見(jiàn)外人,大量時(shí)間招聘,親自把關(guān)人才,甚至親自寫(xiě)代碼、寫(xiě)論文。他們的HR團(tuán)隊(duì)也極其樸素,沒(méi)有那種大公司的“高大上”氣質(zhì)。
這種以“涌現(xiàn)”為關(guān)鍵詞的AI Lab范式,本質(zhì)在于激發(fā)個(gè)體創(chuàng)新潛能,并將其匯聚成組織集體智慧。它強(qiáng)調(diào)信任、自由、賦能,鼓勵(lì)試錯(cuò)、快速迭代,從而在不確定性極強(qiáng)的AI研發(fā)領(lǐng)域,實(shí)現(xiàn)持續(xù)技術(shù)突破和創(chuàng)新。這對(duì)于希望在AI時(shí)代保持競(jìng)爭(zhēng)力的創(chuàng)業(yè)者而言,提供了極具參考價(jià)值的組織構(gòu)建思路。
有一個(gè)非常經(jīng)典的例子可以體現(xiàn)這種“涌現(xiàn)”。DeepSeek的MLA架構(gòu)創(chuàng)新是怎么誕生的?據(jù)說(shuō)源于某個(gè)研究員的個(gè)人興趣,他在總結(jié)主流注意力機(jī)制架構(gòu)演化規(guī)律后,突然靈感迸發(fā),設(shè)計(jì)出新替代方案。這個(gè)方案不是梁文鋒想的,也不是小組攻關(guān)的,就是一個(gè)年輕人“頓悟”出來(lái)的。
再比如,北大在讀博士(博三)王培懿,加入DeepSeek時(shí)并沒(méi)有強(qiáng)化學(xué)習(xí)經(jīng)驗(yàn),但在數(shù)學(xué)研究中獨(dú)立推導(dǎo)出了一個(gè)統(tǒng)一公式,解決了各種訓(xùn)練方法問(wèn)題,這也是一個(gè)“頓悟時(shí)刻”。正是這個(gè)公式,讓R1 Zero變成了今天的R1。
DeepSeek V2論文有150位作者,甚至包含數(shù)據(jù)標(biāo)注人員名字,梁文鋒本人也在其中。這種團(tuán)隊(duì)協(xié)作模式,體現(xiàn)人與人之間的平等交互,沒(méi)有嚴(yán)格的KPI和OKR束縛。
但程序員為了1%性能突破,可不眠不休工作一月,不害怕困難。因?yàn)檫@能激發(fā)天賦和成就感。這種組織,就是為了讓創(chuàng)新能夠自然地“涌現(xiàn)”出來(lái)。
對(duì)于技術(shù)創(chuàng)新驅(qū)動(dòng)的創(chuàng)業(yè)者而言,DeepSeek的組織模式提供了新思路。傳統(tǒng)的金字塔管理、KPI考核,在AI這種高度不確定和需要靈感“涌現(xiàn)”的領(lǐng)域,反而可能成為創(chuàng)新的桎梏。
如果你也是技術(shù)出身的創(chuàng)業(yè)者,你可能更應(yīng)該相信你的團(tuán)隊(duì),尤其是那些對(duì)技術(shù)本身充滿熱情、有好奇心的年輕人。給他們足夠的自由和資源,讓他們?cè)凇盁o(wú)人區(qū)”里探索,而不是把他們框死在既定任務(wù)里。
梁文鋒的做法是:招來(lái)合適的人,交給他重要的事兒,然后就放手讓他自己想辦法,自己發(fā)揮。
還有就是擁抱“非標(biāo)準(zhǔn)”人才。不要只盯著大廠出來(lái)的大咖,那些有潛力的應(yīng)屆生、博士生,他們可能技能多于經(jīng)驗(yàn),但對(duì)研究的渴望遠(yuǎn)超金錢(qián)。他們比較純粹,這樣的年輕人正是你打造“涌現(xiàn)型組織”的基石。
“我們希望培養(yǎng)出自己的團(tuán)隊(duì)?!?這是梁文鋒的野心,也是你可以學(xué)習(xí)的培養(yǎng)團(tuán)隊(duì)的策略。
確保內(nèi)部透明與資源共享。你的計(jì)算資源(比如GPU算力),能不能對(duì)團(tuán)隊(duì)成員沒(méi)有限制?當(dāng)他們有想法時(shí),能不能隨時(shí)調(diào)用訓(xùn)練集群,無(wú)需審批?這種內(nèi)部的“開(kāi)源”和自由度,能夠極大激發(fā)員工的創(chuàng)造力。
請(qǐng)記住,組織的本質(zhì)是人與人之間的交互模式。在AI時(shí)代,你需要打造的,是一個(gè)能夠讓每個(gè)個(gè)體的“心流”與組織的“涌現(xiàn)”融為一體的組織。
DeepSeek的崛起:打破中國(guó)創(chuàng)新者的“思想鋼印”
我們要問(wèn)了:DeepSeek的成就,為何是由看似“名不見(jiàn)經(jīng)傳”的梁文鋒創(chuàng)造的,而不是那些大廠——騰訊、阿里,字節(jié),或者“六小虎”們?
要知道,大廠肩負(fù)著市值壓力,而“六小虎”們則面臨估值重?fù)?dān)。過(guò)去,所有企業(yè)都有一種根深蒂固的慣性,一條“看不見(jiàn)的繩子”牽引著他們:必須盡快實(shí)現(xiàn)商業(yè)化、產(chǎn)品化、應(yīng)用化,追求用戶增長(zhǎng)和營(yíng)收。因?yàn)橛腥谫Y、有市值,就必然有KPI。
那么,這些巨頭為何未能自主創(chuàng)新呢?核心原因就在于一個(gè)“看不見(jiàn)的假設(shè)”——必須快速商業(yè)化、快速賺錢(qián)。在這種心態(tài)下,企業(yè)不敢直面最核心的問(wèn)題,不敢進(jìn)行長(zhǎng)期的基礎(chǔ)投入。
但更深層次的原因是:兩代互聯(lián)網(wǎng)創(chuàng)業(yè)者,從內(nèi)心深處,就不相信中國(guó)企業(yè)有能力做基礎(chǔ)研究。無(wú)論是第一代的BAT,還是第二代的頭部企業(yè),他們嘴上說(shuō)在做,但內(nèi)心深處,即使是中國(guó)最頂尖的幾家大廠,也不敢真正相信自己能做出原創(chuàng)性的基礎(chǔ)研究。
請(qǐng)問(wèn),在DeepSeek之前,有哪家中國(guó)大廠曾公開(kāi)宣稱:“我中國(guó)的模型要做世界第一,我要引領(lǐng)世界”?沒(méi)有。
我們一直活在一種《三體》式的思維定勢(shì)中——美國(guó)人負(fù)責(zé)原創(chuàng),中國(guó)人負(fù)責(zé)應(yīng)用和商業(yè)化。這便是兩代中國(guó)互聯(lián)網(wǎng)創(chuàng)業(yè)者集體潛意識(shí)中的“思想鋼印”。
梁文鋒用行動(dòng)證明了中國(guó)公司在AI基礎(chǔ)研究和模型創(chuàng)新方面同樣具備全球領(lǐng)先的實(shí)力。這種轉(zhuǎn)變,并非僅僅是追趕,而是真正意義上的“技術(shù)領(lǐng)先”。
在過(guò)去30年的IT革命中,中國(guó)幾乎沒(méi)有真正參與核心技術(shù)革命,我們習(xí)慣了摩爾定律從天而降,默認(rèn)可以等18個(gè)月再跟上。這種心態(tài),其實(shí)是一種極大的自我矮化。
但梁文鋒和DeepSeek站了出來(lái),用實(shí)際行動(dòng)說(shuō):“我們不這樣!” 他們相信技術(shù)進(jìn)步是西方科技社區(qū)幾代人持續(xù)努力的結(jié)果,我們中國(guó)人也應(yīng)該參與其中,而不是僅僅做受益者。這種理念上的轉(zhuǎn)變,是DeepSeek在AI基礎(chǔ)研究領(lǐng)域取得突破的關(guān)鍵動(dòng)力。
對(duì)技術(shù)創(chuàng)新驅(qū)動(dòng)的創(chuàng)業(yè)者來(lái)說(shuō),DeepSeek的理念是振聾發(fā)聵的。它呼吁我們打破“思想鋼印”。
你是否也活在“美國(guó)做原創(chuàng),中國(guó)做應(yīng)用”的思維定勢(shì)里?梁文鋒用實(shí)踐證明,這種思想鋼印是可以被打破的。中國(guó)人第三代創(chuàng)業(yè)者也到了必須做,而且可以做,有能力做原創(chuàng)創(chuàng)新的時(shí)候了。這個(gè)時(shí)候到了,不是你也是他。
所以,要敢于挑戰(zhàn)基礎(chǔ)研究的“無(wú)人區(qū)”。不要只盯著眼前的商業(yè)化和利潤(rùn),真正的顛覆性創(chuàng)新往往需要長(zhǎng)期的投入和對(duì)未知的好奇心。創(chuàng)新不僅僅是商業(yè)驅(qū)動(dòng)的,它需要好奇心和創(chuàng)造的野心。我們只是被習(xí)慣束縛住了,這就是你內(nèi)心那根“看不見(jiàn)的馬繩”。
梁文鋒的行為很多時(shí)候?qū)σ粋€(gè)創(chuàng)業(yè)者的身份來(lái)說(shuō)是“瘋狂”的——在2021年最糟糕的年份,他還投入巨資建設(shè)算力集群,這絕非投機(jī)者能做出的決策,而是信仰者。
“我不是因?yàn)榻裉霢I火了,我今天做AI的,我是一直有這個(gè)夢(mèng)想的?!?這種純粹的初心,才是支撐人穿越低谷、走向成功的真正動(dòng)力。

DeepSeek創(chuàng)始人梁文鋒
結(jié)語(yǔ):
“認(rèn)知型創(chuàng)新”精髓就在于對(duì)技術(shù)本質(zhì)的深刻理解與戰(zhàn)略性重構(gòu)。DeepSeek的出現(xiàn),為中國(guó)AI產(chǎn)業(yè)注入了強(qiáng)大信心動(dòng)力,更點(diǎn)亮了中國(guó)在AI時(shí)代成為世界基座的希望,這在工業(yè)革命以來(lái)是前所未有的。
轉(zhuǎn)念就是改命。如果我們這一代創(chuàng)業(yè)者能夠打破內(nèi)心的思想鋼印,敢于在基礎(chǔ)研究領(lǐng)域邁出那一步,那將是中國(guó)創(chuàng)新史上的一個(gè)重要轉(zhuǎn)折點(diǎn)。
所以,我們要永遠(yuǎn)相信中國(guó),永遠(yuǎn)相信創(chuàng)新者。
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表創(chuàng)業(yè)邦立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問(wèn),請(qǐng)聯(lián)系editor@cyzone.cn。







