
作者丨漫地
編輯丨關(guān)雎
圖源丨Midjourney
距離富有人情味的AI語音客服面世,還要多久?
最近,總部位于倫敦的初創(chuàng)公司PolyAI拿到了8600 萬美元(人民幣約6億元)的D 輪融資,這家公司正在做的事情專攻一個點——打造可以像人工對話一樣自然的AI語音客服。
此輪投資,由著名風(fēng)投公司Georgian、Hedosophia和Khosla Ventures共同領(lǐng)投。其他投資者包括英偉達(dá)旗下的NVentures、英國商業(yè)銀行、花旗創(chuàng)投、Squarepoint Ventures、Sands Capital Ventures、Zendesk Ventures 和 Point72 Ventures。
01劍橋博士的創(chuàng)業(yè)路
PolyAI由Nikola Mrk?i?、Tsung-Hsien Wen和Pei-Hao Su于2017年創(chuàng)立,他們是在劍橋大學(xué)機器智能實驗室的對話系統(tǒng)小組相識的。
Nikola此前在劍橋大學(xué)獲得機器學(xué)習(xí)博士學(xué)位,他在人工智能語音領(lǐng)域的從業(yè)經(jīng)歷,可以追溯到更早的時候。

Nikola Mrk?i? 圖源:PolyAI
在他碩士畢業(yè)的時候,原本計劃去瑞士信貸(Credit Suisse)實習(xí),走上大多數(shù)學(xué)生都會選擇的一條高成就、低風(fēng)險的職業(yè)道路。但他的碩士導(dǎo)師,機器學(xué)習(xí)領(lǐng)域的傳奇人物Zoubin Ghahramani 提醒他:“別去做個只會做PPT的家伙?!?/p>
于是機緣巧合下,Nikola作為首位員工加入了彼時初創(chuàng)的語音技術(shù)公司 VocalIQ。2015年, VocalIQ被蘋果收購,主要是為了將VocalIQ的技術(shù)用于蘋果的語音助手Siri中,讓它變得更加智能。那個時候的VocalIQ產(chǎn)品,可以對用戶提出的語義不明確的問題進(jìn)行追問,就好像是和真正的人在交流一樣。
有了這段智能語音的從業(yè)基礎(chǔ),在VocalIQ被收購的兩年后,Nikola 與兩位來自臺灣的研究員 Tsung-Hsien Wen 和 Pei-Hao Su 決定更深入地探索語音助手領(lǐng)域。于是 PolyAI應(yīng)運而生,其使命很簡單:打造不會讓用戶感到被區(qū)別對待的語音助手。
Nikola此前在接受媒體采訪時談到,“我們團(tuán)隊從零開始重建了語音助手的整個基礎(chǔ)設(shè)施?!?最后,一個不僅能識別語音,還能理解語音、適應(yīng)語音內(nèi)容并像人一樣回答問題的平臺就這樣誕生了。
在一個人們大談延遲性和準(zhǔn)確性的技術(shù)環(huán)境里,PolyAI憑借其專有模型、戰(zhàn)略自主性和以客戶為中心的理念(超越技術(shù)層面)保持領(lǐng)先地位。談起經(jīng)營理念,Nikola認(rèn)為, “我們專注于讓用戶真正感受到優(yōu)質(zhì)服務(wù)。這才是制勝之道?!?/p>
02一個像真人一樣回答問題的平臺
都在做AI語音,怎么和其他同類對手區(qū)分開來?
PolyAI抓住了企業(yè)運用語音客服卻普遍無法做到反應(yīng)靈敏、以及場景適應(yīng)性差的痛點。
于是,創(chuàng)造一個足夠智能的對話式Agent就變得很重要!PolyAI將其定位在幫助企業(yè)管理客戶互動——它不僅能夠理解復(fù)雜的多輪對話,處理不同地區(qū)的口音和語言,還能完成客戶的身份驗證、預(yù)訂和支付等端到端任務(wù)。
對于顧客在語音通話中產(chǎn)生的中斷、解釋、甚至是離題的對話場景,PolyAI都能用傳統(tǒng)交互式語音應(yīng)答系統(tǒng)無法做到的方式來處理,這背后的技術(shù)支撐是PolyAI專為電話對話優(yōu)化的語音識別和對話模型。

圖源:Poly AI官網(wǎng)
“據(jù)我所知,我們是唯一一家運行擁有數(shù)十種不同語言、適用于不同場景/用例的自動化系統(tǒng)的公司。” PolyAI的CEO Nikola顯然以此為傲。對于AI公司對語音人工智能的打造,Nikola認(rèn)為,并不僅僅只是為了取代企業(yè)呼叫中心的人工客服,它能做的事情還應(yīng)該更多,包括自動化處理那些人工操作成本過高的任務(wù)來幫助企業(yè)提高收入?!拔覀兊娜斯ぶ悄懿粌H會接聽顧客的每一個電話,而且從不忘記向他們順帶推銷其他產(chǎn)品?!?/p>
八年前,這家公司的前身只是劍橋大學(xué)呼叫中心開發(fā)的AI助手,這些助手用來引導(dǎo)客戶處理各種咨詢、每天處理數(shù)百萬個電話。
但是現(xiàn)在, PolyAI的客戶群涵蓋金融服務(wù)、醫(yī)療保健、酒店和零售等行業(yè),許多大企業(yè)客戶都在采用他們的智能語音平臺,包括萬豪酒店、凱撒娛樂和Foot Locker等知名企業(yè)。PolyAI正在為加州最大的能源公司太平洋煤氣電力公司 (Pacific Gas and Electric Co.) 處理有關(guān)停電的客戶問詢電話,為意大利聯(lián)合信貸銀行 (UniCredit SpA) 處理有關(guān)新開銀行卡和遺失信用卡的咨詢,并為拉斯維加斯的賭場(例如凱撒宮和金塊賭場)處理餐廳訂單。
根據(jù)PolyAI公開的財務(wù)記錄顯示,截至2024年1月31日的12個月內(nèi),其收入為890萬美元,而到2025年同期,收入已超過1500萬美元。PolyAI的CEO Nikola稱,PolyAI語音的逼真度和靈活性使其在過去一年中實現(xiàn)了銷售額的顯著增長。他向媒體表示,公司有望在2025財年實現(xiàn)年度經(jīng)常性收入翻番,超過4000萬美元,其中美國客戶的銷售額預(yù)計將增長兩倍。
營收不斷增長,PolyAI融資的腳步也是不斷。從2017年至今,其一共進(jìn)行了六輪融資。最近這筆8600萬美元的融資里,英偉達(dá)的NVentures、科斯拉風(fēng)投(Khosla Ventures )、Point72 Ventures、Sands Capital Ventures等機構(gòu)都是多次跟投。本輪融資也使該公司迄今為止的總?cè)谫Y額超過2億美元,目前,PolyAI的估值達(dá)到7.5億美元。

對于最近的這筆新投資,PolyAI計劃進(jìn)一步開發(fā)其Agent Studio平臺技術(shù),并擴大市場推廣力度。
03中美人工智能語音市場前進(jìn)到哪了?
對PolyAI 進(jìn)行風(fēng)險投資的機構(gòu)都清楚地認(rèn)識到人工智能帶來的機遇。
相較于市面上其它也在做語音客服的競品,PolyAI 更關(guān)注高質(zhì)量的語音交互。這使它區(qū)別于 Five9、Genesys 或 Avaya 等更廣泛的聯(lián)絡(luò)中心平臺,以及Cognigy、Kore.ai 或 Leaping AI 等更以工作流程為中心的對話式 AI 參與者。這些參與者通常跨越多個渠道,但在逼真、復(fù)雜的語音通話方面則顯得不太專業(yè)。
PolyAI 的競爭對手包括多家美國語音人工智能初創(chuàng)公司,這些公司近幾個月也吸引了大量風(fēng)險投資。其中包括Sierra Technologies 在9月份完成了一輪3.5億美元的巨額融資,使其估值超過100億美元;而總部位于舊金山的Decagon AI在6月份的融資中獲得了1.31億美元,估值達(dá)到15億美元。該公司在歐洲也面臨著激烈的競爭,總部位于巴黎的Parloa GmbH在5月份融資1.2億美元,估值達(dá)到10億美元。
PolyAI的CEO Nikola表示,PolyAI與其競爭對手的主要區(qū)別之一在于,它開發(fā)了自己的大型語言模型,這使其在真實性方面具有優(yōu)勢。而它的競爭對手只是簡單地接入OpenAI等公司或Eleven Labs 等語音AI初創(chuàng)公司的大語言模型。
回到中國智能客服市場來看,明顯呈現(xiàn)出一個頭部企業(yè)聚集的格局??拼笥嶏w、百度、阿里、騰訊、華為云紛紛布局智能語音??拼笥嶏w憑借全棧自研技術(shù)深耕教育與醫(yī)療等垂直行業(yè),走“AI+剛需”的技術(shù)驅(qū)動路線;百度與阿里均側(cè)重生態(tài)構(gòu)建,但百度以DuerOS和小度硬件主攻家庭入口,阿里則依托電商、支付生態(tài)將語音深度融入商業(yè)場景;騰訊將語音作為底層能力賦能其社交與游戲等核心業(yè)務(wù),布局相對內(nèi)斂。
而近幾年中國的AI智能語音初創(chuàng)公司數(shù)量上相對美國市場較少,它們大都通過深耕細(xì)分領(lǐng)域(金融、政務(wù)、跨境等)和技術(shù)差異化(低延遲、方言支持、合規(guī)適配)來構(gòu)建護(hù)城河。比如賽舵智能深耕金融場景定制化語音機器人,云蝠智能的核心產(chǎn)品線包括大模型語音智能體,為企業(yè)提供CRM及AICC大模型呼叫中心,以及智齒科技通過提供全渠道的客戶聯(lián)絡(luò)解決方案,嵌入到企業(yè)的營銷、服務(wù)等多個環(huán)節(jié)。

回到PolyAI來看,Georgian Capital的投資人 Emily Walsh 表示,這是她第二次投資這家初創(chuàng)公司?!皩τ谌蜃畲蟮钠放贫?,客戶服務(wù)不再僅僅是一個成本中心,而是一個巨大的價值創(chuàng)造機會,”她說道?!癙olyAI 能夠在企業(yè)級規(guī)模上部署栩栩如生的語音助手,從而帶來顯著的成本節(jié)約和收入增長?!?/p>
而作為一個創(chuàng)業(yè)者,Nikola認(rèn)為,打開想象力很重要。如今很多語音類的產(chǎn)品創(chuàng)新能力不夠,這表現(xiàn)在它們往往只是一些輔助工具,讓客服人員的工作能力略有提升。
“但是,你要想象一下這樣的一個世界:大部分工作都實現(xiàn)了自動化,人只需要輔以適當(dāng)?shù)娜斯じ深A(yù)就可以了。我們要構(gòu)建的是一個由人工智能驅(qū)動、高薪知識型員工主導(dǎo)的世界。所以,現(xiàn)在就開始實現(xiàn)電話自動化吧!”
本文為創(chuàng)業(yè)邦原創(chuàng),未經(jīng)授權(quán)不得轉(zhuǎn)載,否則創(chuàng)業(yè)邦將保留向其追究法律責(zé)任的權(quán)利。如需轉(zhuǎn)載或有任何疑問,請聯(lián)系editor@cyzone.cn。







