OpenAI發(fā)布語(yǔ)音模型VoiceEngine,出于安全考慮僅小范圍試用
界面新聞?dòng)浾?| 于浩界面新聞編輯 | 文姝琪3月30日,OpenAI在官網(wǎng)上公開(kāi)了其最新的研究成果——“Voice Engine”。這項(xiàng)技術(shù)可通過(guò)簡(jiǎn)短的15秒音頻樣本和文本輸入,生成與原始說(shuō)話(huà)者極為相似的自然語(yǔ)音。在公告中,OpenAI給出了Voice Engine的一些早期應(yīng)用場(chǎng)景。如通過(guò)自然、富有情感的聲音輔助兒童閱讀、翻譯視頻和播客等內(nèi)容、改善偏遠(yuǎn)地區(qū)的社區(qū)服務(wù)、幫助患有突發(fā)性或退化性言語(yǔ)病癥的患者恢復(fù)聲音等。針對(duì)上述應(yīng)用場(chǎng)景,OpenAI也分別給出了和少數(shù)“值得信賴(lài)”的合作伙伴共同完成的技術(shù)案例。兒童教育公司Age of Learning使用GPT-4與Voice Engine與學(xué)生進(jìn)行個(gè)性化的交流;人工智能替代通信應(yīng)用程序Livox通過(guò)使用語(yǔ)音引擎,為殘疾人提供跨多種語(yǔ)言的自然聲音;此前靠“Taylor Swift說(shuō)中文”等視頻爆火的Heygen也有使用Voice Engine。OpenAI稱(chēng),Voice Engine技術(shù)于2022年底開(kāi)始開(kāi)發(fā),目前已經(jīng)為文本轉(zhuǎn)語(yǔ)音API和ChatGPT的朗讀功能提供預(yù)設(shè)語(yǔ)音。至于模型訓(xùn)練的數(shù)據(jù)來(lái)源問(wèn)題,OpenAI語(yǔ)音引擎產(chǎn)品團(tuán)隊(duì)成員杰夫·哈里斯 (Jeff Harris)在接受媒體采訪時(shí)表示,該模型是根據(jù)“許可數(shù)據(jù)和公開(kāi)數(shù)據(jù)的組合”進(jìn)行訓(xùn)練的。盡管此前已經(jīng)為“Voice Engine”申請(qǐng)了商標(biāo),但是對(duì)于未來(lái)是否要大規(guī)模部署這項(xiàng)技術(shù),OpenAI仍保持保守態(tài)度。2024年2月,美國(guó)曾發(fā)布了少數(shù)公司利用總統(tǒng)的人工智能語(yǔ)音來(lái)影響選民投票的事件,類(lèi)似的潛在風(fēng)險(xiǎn)也是OpenAI選擇先小范圍應(yīng)用Voice Engine的一大原因。 公告中顯示,由于合成語(yǔ)音存在被濫用的可能性,OpenAI希望就合成聲音的負(fù)責(zé)任部署以及社會(huì)如何適應(yīng)這些新功能展開(kāi)討論,根據(jù)討論和小規(guī)模測(cè)試的結(jié)果,OpenAI將會(huì)對(duì)是否大規(guī)模部署這項(xiàng)技術(shù)做出決定。OpenAI在人工智能安全方面曾早早做出準(zhǔn)備。2023年10月,OpenAI 宣布成立“準(zhǔn)備團(tuán)隊(duì)”(Preparedness team),旨在監(jiān)測(cè)和評(píng)估前沿模型的技術(shù)和風(fēng)險(xiǎn);隨后于2023年12月,OpenAI進(jìn)一步公布了“準(zhǔn)備框架”(Preparedness Framework),介紹了圍繞OpenAI“追蹤、評(píng)估、預(yù)測(cè)和防范災(zāi)難性風(fēng)險(xiǎn)”所制定的一系列機(jī)制。對(duì)于Voice Engine,OpenAI表示正在探索對(duì)合成聲音加水印或添加控制措施的方法,以防止人們使用帶有政治家或其他知名人物聲音的技術(shù)。