OpenAI釋出ChatGPT的超真實聲音給部分付費用戶

OpenAI於星期二開始推出了ChatGPT的高級語音模式,讓用戶首次接觸到GPT-4o超真實的音頻回應。這個測試版將於今天提供給一小群ChatGPT Plus用戶,OpenAI表示這一功能將在2024年秋季逐步推廣至所有Plus用戶。

當OpenAI在五月展示GPT-4o的聲音時,這一功能以快速回應和與真人聲音(特別是一位特定的聲音)的驚人相似度而震驚觀眾。該聲音名為Sky,與電影《Her》中人工助手背後的女演員斯嘉麗·約翰遜(Scarlett Johansson)相似。在OpenAI的演示之後不久,約翰遜表示拒絕了首席執行官山姆·奧特曼(Sam Altman)多次使用她的聲音的請求,而在看到GPT-4o的演示後,她聘請了法律顧問來捍衛她的肖像權。OpenAI否認使用約翰遜的聲音,但後來刪除了演示中展示的聲音。六月份,OpenAI表示將延遲發布高級語音模式以改進其安全措施。

經過一個月後,等待結束了(在某種程度上)。OpenAI表示春季更新中展示的視頻和屏幕共享功能將不包括在這個測試版中,將在“晚些時候”推出。目前,令所有人驚艷的GPT-4o演示仍然只是一個演示,但一些高級用戶現在將可以使用在那裡展示的ChatGPT的語音功能。

ChatGPT現在可以說話和聆聽

您可能已經嘗試了ChatGPT目前可用的語音模式,但OpenAI表示高級語音模式不同。ChatGPT以前的音頻解決方案使用了三個獨立模型:一個將您的聲音轉換為文字,GPT-4處理您的提示,然後第三個將ChatGPT的文字轉換為聲音。但是GPT-4o是多模式的,能夠在沒有輔助模型的情況下處理這些任務,從而創建具有顯著較低延遲的對話。OpenAI還聲稱GPT-4o能夠感知您聲音中的情感語調,包括悲傷、興奮或唱歌。

在這個試點項目中,ChatGPT Plus用戶將第一手體驗OpenAI的高級語音模式的超真實性。TechCrunch在發布本文之前無法測試這一功能,但我們在獲得訪問權限後將對其進行評估。

OpenAI表示,他們正在逐步釋出ChatGPT的新語音功能,以密切監控其使用情況。處於測試組的人將在ChatGPT應用程序中收到警報,然后收到一封包含使用說明的電子郵件。

自OpenAI的演示以來的幾個月中,該公司表示他們與使用45種不同語言的100多名外部紅隊成員測試了GPT-4o的語音功能。OpenAI表示將在八月初發布有關這些安全工作的報告。

該公司表示,高級語音模式將僅限於ChatGPT的四種預設聲音-Juniper、Breeze、Cove和Ember-這些聲音是與付費聲音演員合作製作的。在OpenAI五月的演示中展示的Sky聲音不再在ChatGPT中可用。OpenAI發言人林賽·麥卡倫表示:“ChatGPT不能模仿其他人的聲音,包括個人和公眾人物,並將阻止與這些預設聲音不同的輸出。”

OpenAI正在努力避免深度偽造爭議。今年一月,人工智能初創公司ElevenLabs的語音克隆技術被用來模仿拜登總統,欺騙新罕布什爾州的初選選民。

OpenAI還表示,他們引入了新的過濾器來阻止生成音樂或其他受版權保護的音頻的某些請求。在過去的一年里,人工智能公司因版權侵權而陷入法律麻煩,而GPT-4o等音頻模型開創了一個全新的可以提出投訴的公司類別。尤其是,唱片公司曾一直以好訴訟名稱著稱,他們已經起訴了AI歌曲生成器Suno和Udio。