
編者按:本文來自微信公眾號(hào) 有新Newin(ID:NewinData),作者: 有新,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
Builders 是由 @Magineer、@有新Newin以及 @深思SenseAI聯(lián)合推出的人物專欄,旨在發(fā)現(xiàn)與分享更多的優(yōu)秀出海創(chuàng)業(yè)團(tuán)隊(duì)與獨(dú)立開發(fā)者,我們將定期邀請(qǐng)生態(tài)范圍內(nèi)的創(chuàng)始人與團(tuán)隊(duì)展開對(duì)話。
今天我們邀請(qǐng)到的嘉賓是 00 后創(chuàng)業(yè)者凌天格,天格是一位 00 后的年輕創(chuàng)業(yè)者,就讀 CMU 計(jì)算機(jī),當(dāng)時(shí)還沒畢業(yè)就創(chuàng)立了格子互動(dòng),并拿到了源碼以及奇績(jī)的投資。
格子互動(dòng)團(tuán)隊(duì)的第一款產(chǎn)品是 “Halo劇本殺”,一款在線劇本殺游戲應(yīng)用,提供真人聲優(yōu)級(jí)別的 DM,而“大餅AI”是在觀察到聲音與場(chǎng)景、角色之間的關(guān)聯(lián)后產(chǎn)生的想法,格子互動(dòng)的愿景是實(shí)現(xiàn)聲音的自由,讓每個(gè)人都能擁有完美的聲音。
有新:請(qǐng)先簡(jiǎn)單介紹一下自己以及公司?
凌天格:我是凌天格,00 后,本科就讀 CMU 計(jì)算機(jī)系,還沒畢業(yè)就成立了格子互動(dòng),一個(gè)少年感十足,平均年齡 95 后的創(chuàng)業(yè)團(tuán)隊(duì)。我們的愿景是實(shí)現(xiàn)聲音的自由,人人擁有完美好聲音。

目前主要的產(chǎn)品是大餅 ai 變聲,海外版叫 Dubbing AI,一個(gè)簡(jiǎn)單好用的實(shí)時(shí)ai變聲器,可以把你的聲音變成任何人。
有新:作為一名 00 后創(chuàng)業(yè)者,你當(dāng)時(shí)為什么選擇創(chuàng)業(yè)?
凌天格:我感覺創(chuàng)業(yè)就是我應(yīng)該做的,只是沒想好什么時(shí)間開始??赡苁钱厴I(yè)就開始,也可能讀研后,或者在美國(guó)工作一段時(shí)間再開啟。但因?yàn)橐咔樵虮究粕狭撕芫镁W(wǎng)課,閑暇時(shí)間開始和同學(xué)們搞 Side Project,沒想到第一個(gè)產(chǎn)品就做到了千萬年收入,所以當(dāng)即就 all in 創(chuàng)業(yè)了。
有新:格子互動(dòng)團(tuán)隊(duì)的第一款產(chǎn)品是「Halo劇本殺」,這是一款什么樣的產(chǎn)品?
凌天格:簡(jiǎn)單來說,Halo 劇本殺是首個(gè)真人聲優(yōu)級(jí) DM 線上帶本的劇本殺 App。我們一比一的將線下的劇本殺體驗(yàn)還原到了線上,無論是劇本,線索卡,還是 DM。

有新:現(xiàn)在為什么選擇做 DubbingAI,兩者之間有什么樣的契機(jī)或聯(lián)系么?
凌天格:在做劇本殺的時(shí)候,我們觀察到了聲音和場(chǎng)景、人物角色很巧妙的關(guān)聯(lián)性。比如說歡樂的場(chǎng)景與角色天然適合小岳岳的音色與口音,抒情曖昧的場(chǎng)景與志林姐姐的聲音完美契合。一旦聲音與場(chǎng)景匹配,用戶的體驗(yàn)是指數(shù)級(jí)的提升的。所以當(dāng)時(shí)就有了虛擬聲音濾鏡的想法,慢慢就演變成了現(xiàn)在的大餅 ai。

有新:這款產(chǎn)品主要的功能是什么?較同類產(chǎn)品而言有哪些差異性?
凌天格:聲音克隆+實(shí)時(shí)變聲,大餅 ai 可以把你的聲音變成任何人,生成的聲音逼真自然且極其富有情感。我們?cè)?Win 和 Mac 端都發(fā)布了我們的 App。打開大餅 ai 后,我們軟件將代理電腦的麥克風(fēng),這時(shí)你再開啟任何社交軟件或游戲,在產(chǎn)品內(nèi)說話就可以實(shí)現(xiàn)變聲啦~

與其說變聲,用換聲來定義產(chǎn)品更精準(zhǔn)。最大的差異是我們使用了全新的 Transformer 架構(gòu)實(shí)現(xiàn)實(shí)時(shí)換聲,與傳統(tǒng)的調(diào)音/聲卡等技術(shù)路徑完全不一樣。傳統(tǒng)方法無法實(shí)現(xiàn)聲音克隆,大多只能變?yōu)榉侨祟惵曇?,例如大黃蜂,小黃人,擎天柱。且只能改變有限的聲音參數(shù),例如給聲音加混響,調(diào)音高等,實(shí)現(xiàn)簡(jiǎn)單的美化。
有新:你們的用戶主要是哪幾類群體?
凌天格:游戲玩家是我們最大的用戶群。在游戲開黑的時(shí)候使用我們的產(chǎn)品和隊(duì)友交流也是最常用的場(chǎng)景,無論是整蠱熟人,還是開變聲讓自己更加放松的開麥和陌生的隊(duì)友溝通,變聲都是一個(gè)很實(shí)用的工具。

主播和內(nèi)容創(chuàng)作者也是我們的核心用戶群,固定一個(gè)聲音來配合虛擬形象直播,或是變聲整活節(jié)目效果,我們都有和不少主播合作過~內(nèi)容創(chuàng)作者使用我們的產(chǎn)品不僅可以提高產(chǎn)出的效率,也可以讓內(nèi)容更加多變有意思。
有新:在開發(fā)產(chǎn)品過程中,有遇到什么樣的挑戰(zhàn)么?或者說同類產(chǎn)品還沒有解決的?
凌天格:遇到的第一個(gè)也是我們覺得最需要攻克的挑戰(zhàn)就是要在保證效果的同時(shí)還要保證消耗的電腦性能足夠低。作為一個(gè)工具類產(chǎn)品,我們自然希望使用門檻越低越好,我們也觀察到很多用戶的電腦可能在配置上沒有很好的 CPU 或者壓根沒有顯卡。所以最開始近 30% 的 CPU 占用很難滿足他們的需求。所以我們從上線到現(xiàn)在一直都在努力優(yōu)化性能占用,到現(xiàn)在只需要個(gè)位數(shù)的 CPU 占用,也是很多同類產(chǎn)品所很難達(dá)到的。
有新:未來你們還會(huì)上線什么樣的產(chǎn)品功能?
凌天格:我們準(zhǔn)備再?gòu)恼f話本身出發(fā),推出口音消除和口音增強(qiáng)的兩個(gè)功能。舉例來說就是可以從 Chinglish 轉(zhuǎn)化為 English,同時(shí)保留你的音色和情感;也可以從普通話轉(zhuǎn)化為臺(tái)灣腔~ 再未來就是吧變聲,口音,與翻譯結(jié)合,實(shí)現(xiàn) real time dubbing,也就是能還原情感與聲音的實(shí)時(shí)翻譯。
有新:你們也上線了海外版,不同市場(chǎng)的用戶習(xí)慣和付費(fèi)情況有什么差異性?
凌天格:國(guó)內(nèi)外的付費(fèi)模式,客單價(jià)都有差異。因?yàn)閲?guó)內(nèi)主要游戲用戶為主,所以國(guó)內(nèi)版本主打游戲化售賣策略,周免音色+音色皮膚買斷制。和王者榮耀一樣,每周輪換不同的免費(fèi)音色給用戶使用,喜歡就付費(fèi)買下永久版,單一聲音 19/39/59 人民幣。

當(dāng)然,也會(huì)運(yùn)用經(jīng)典的游戲運(yùn)營(yíng)策略比如首充,累充,分享,連續(xù)登陸等。海外就簡(jiǎn)單很多,訂閱套餐 9.9 美元/月,聲音克隆和一些稀有音色獨(dú)立收費(fèi)。
有新:你是如何思考這款產(chǎn)品的商業(yè)模式的?
凌天格:目前我們的付費(fèi)留存,持續(xù)付費(fèi),月付費(fèi) ARPU 數(shù)據(jù)都還不錯(cuò),海外更是平均比國(guó)內(nèi)高 30%~40%,同時(shí)因?yàn)槲覀冏兟暿嵌藴y(cè)計(jì)算,所以毛利還不錯(cuò)(讓我們可以花更多經(jīng)費(fèi)迭代產(chǎn)品與算法~)
我們?cè)O(shè)計(jì)商業(yè)模式第一步是主觀判斷,因?yàn)槲覀?Day1 知道主要是誰(shuí)在用我們的產(chǎn)品,所以直接根據(jù)用戶畫像匹配他們習(xí)慣的付費(fèi)模式。第二就是觀察數(shù)據(jù),再根據(jù)數(shù)據(jù)微調(diào)策略。
有新:在產(chǎn)品早期冷啟動(dòng)和增長(zhǎng)中,你們是如何思考 GTM 策略的?
凌天格:我們覺得 GTM 最重要的還是定義清楚你的產(chǎn)品。比如到底有啥用,服務(wù)誰(shuí),用戶為啥用。在細(xì)一點(diǎn)就是用戶在哪用,用多久,和誰(shuí)用這些用戶行為。這些看清了之后,你大概也明確了你的對(duì)手了。作為小創(chuàng)業(yè)公司,一般我們的新方案要比之前的方案好至少一倍以上,我們做 GTM 賠率才夠高。
這些定好了之后,就是做好曝光和運(yùn)營(yíng)收口。曝光的做法不同團(tuán)隊(duì)風(fēng)格差異很大,膽子大一點(diǎn)想做爆,一般我們依賴 kol 和內(nèi)容營(yíng)銷,這種做法可能虧,也可能大賺。穩(wěn)一點(diǎn)就去做 SEM,做信息流廣告,這些賬其實(shí)流量大廠都給咱算好了,咱持續(xù)優(yōu)化 ROI 和 LTV就行。
有新:在探索不同市場(chǎng)的過程中,有什么有趣的發(fā)現(xiàn)么?
凌天格:我們發(fā)現(xiàn)做大多數(shù)市場(chǎng)都有一個(gè)共性,勇一點(diǎn)膽子大一點(diǎn),沖就完事了。時(shí)間比什么都貴,早一個(gè)月,可能啥都不一樣了。我們一直維持小步快跑的節(jié)奏,每周必須發(fā)一個(gè)版本,產(chǎn)品迭代的手感得維持。
有新:最近有刷到哪些好玩的 AI 類產(chǎn)品或者相關(guān) AI 生成的內(nèi)容?
凌天格:最近挺多ai+消費(fèi)電子的結(jié)合我感覺都挺酷的,雖然有點(diǎn)早期,但打開了很多思路
有新:如何看待 GenAI+聲音這個(gè)賽道?未來的 TAM 會(huì)有多大?
凌天格:我們觀察現(xiàn)在 GenAI+ 聲音主要有兩類大玩家,一類是做非實(shí)時(shí)的 text to voice/music,服務(wù)內(nèi)容創(chuàng)作,比如剪映,11labs;另一類是實(shí)時(shí)的 Voice Generation,比如我們大餅 ai,或者 Sanas.ai 和 Tomato.ai,主攻實(shí)時(shí)變聲,口音消除與翻譯。兩類我們覺得未來 TAM 都大到現(xiàn)在很難判斷,未來所有的聲音都會(huì)是 AI 生成的,這里包括了現(xiàn)在的存量市場(chǎng),還有 VR,Metaverse 等增量市場(chǎng)。
有新:有什么游戲或者影視文學(xué)類作品的角色讓你印象深刻?這里面有什么你們的產(chǎn)品可以結(jié)合的地方?
凌天格:頭號(hào)玩家!在虛擬世界里你可以成為任何人,當(dāng)然,那時(shí)候大餅也能幫你擁有任何聲音,口音,與語(yǔ)言能力。
有新:作為一名 00 后創(chuàng)業(yè)者,你會(huì)給同齡的年輕創(chuàng)業(yè)者哪些建議?
凌天格:早點(diǎn)開始做起來,不要想太多做太少。一般都是邊做邊想,創(chuàng)業(yè)的飛機(jī)邊造邊飛。
有新:你個(gè)人在這兩段項(xiàng)目創(chuàng)業(yè)過程中最大的收獲是什么?
凌天格:創(chuàng)業(yè)和 CMU 給我留下的 Lesson 很像:創(chuàng)業(yè)就像一場(chǎng)游戲,困難就是游戲關(guān)卡,都是設(shè)計(jì)好的,也一定會(huì)來。但困難與關(guān)卡存在的意義就是留給我們戰(zhàn)勝的。莫慌,大不了再來一次,再大不了調(diào)整下關(guān)卡難度,問題總會(huì)解決的。

本文(含圖片)為合作媒體授權(quán)創(chuàng)業(yè)邦轉(zhuǎn)載,不代表創(chuàng)業(yè)邦立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問,請(qǐng)聯(lián)系editor@cyzone.cn。







