在今年的聲網式A時機 RTE2025 實時互聯網大會上,聲網正式發布了對話式 AI 引擎2.0版本,對話該版本實現“優雅打斷”的引預注升級,支持過濾無語義附和詞,擎讓讓 AI 更懂開口的更懂時機;支持預注冊聲紋識別,AI 能分辨是開口誰在講話;新增電話外呼功能,支持 SIP、支持PSTN 電話,冊聲通過 AI Studio 編排或一行代碼即可實現,紋識穩定性高。別電同時新版本還支持國內外更豐富的話外呼 ASR 與 TTS 供應商,用戶可根據自己需求選擇想要的聲網式A時機語種和音色。
對話式 AI 引擎最新產品架構圖
優雅打斷2.0 讓 AI 更懂開口時機
在人與人對話中,對話經常為了表示認同會發出“嗯”、引預注“啊”、擎讓“是的”等常見的語義附和詞,但在 AI 對話中,用戶并不希望因為自己無意中的一些語義附和詞,讓 AI 提前響應,這樣會給對話體驗造成比較割裂的體驗感,在教育、會議等很多場景也有很多詞需要提前過濾,不需要被 AI 響應。
基于此,對話式 AI 引擎2.0版對“優雅打斷”功能進行了升級,不僅支持過濾對話中無語義的附和詞,自動識別“嗯”、“啊”等對話附和詞,避免誤觸發響應,還可以過濾自定義的文本,以適應不同業務場景需求。
預注冊聲紋識別 讓 AI 知道是誰在說話
在對話式 AI 中,多人同時與 AI 互動的場景將會越來越多,家居場景中,父母與孩子都會與 AI 互動,孩子不希望聊的內容被爸爸媽媽發現,所以希望 AI 能夠區分自己與父母的身份,在和 AI 對話時可以產出不同的內容。
針對這樣的需求,聲網對話式 AI 引擎2.0 上線了預注冊聲紋識別,用戶僅需4-10秒鐘的有效語音注冊,可以快速建立聲紋模型,對話的過程也是實時進行比對,基本沒有任何體感延遲。且整個過程不存儲任何聲紋數據。通過提前注冊不同人的聲紋,不僅能讓 AI分辨出多說話人聲紋,知道是誰在說話。還可以針對不同任務的標簽輸出不同的對話策略與內容推薦,無論是對于教育、情感陪伴類業務場景還是隱私保護都很有價值。
支持 AI 電話外呼 一行代碼即可撥打體驗
在“2025對話式 AI 場景熱力榜單”中 AI 客服位列Top6,僅次于 AI 語音助手、AI 硬件類熱門場景,而 AI 客服場景中電話是核心工具,電話也是目前全球范圍內最通用的商業觸達用戶的接口。對話式 AI 引擎自發布以來,也收到了很多企業用戶對 AI 客服場景的需求。
聲網一直希望將對話式 AI 能力賦予到電話中,正式在2.0 版本中推出電話外呼功能,支持SIP/PSTN 電話,開發者可以通過聲網最新發布的對話式 AI Studio 進行工作流編排,通過 UI 手動配給就可以完成電話撥打,導入號碼,審核完成后,直接綁定外呼智能體,再點擊撥打。如果想在生產中部署,可以通過一行代碼撥打電話,非常便捷,且穩定性可靠。
此外,2.0 版本還接入了國內、海外更豐富的 ASR / TTS 供應商,開發者將擁有更多語種、音色可選擇,同時我們也支持第三方自研語音合成的接入,供應商定制、克隆等自定義音色也能上線。


相關文章




精彩導讀
熱門資訊
關注我們