OpenAI首次展示語音生成模型Voice Engine:可複製原聲
當地時間3月29日,OpenAI在官網首次展示了名爲“Voice Engine”的語音生成模型。該模型正處於小規模預覽階段,可利用文本輸入和單個15秒音頻樣本來生成與原聲非常相似的自然語音。據介紹,OpenAI於2022年底首次開發出該模型,並已將其應用於其文本轉語音API以及ChatGPT語音和朗讀功能中的預設語音。OpenAI表示,由於合成語音被濫用的潛在風險,其將採取謹慎和知情的方式進行更廣泛的發佈。
相關資訊
- ▣ OpenAI首次展示音頻模型Voice Engine 15秒即可複製原音
- ▣ 全球科技早參丨OpenAI發佈語音模型Voice Engine
- ▣ OpenAI發佈語音模型Voice Engine,出於安全考慮僅小範圍試用
- 更厲害!OpenAI推Voice Engine技術 15秒聲音範本可合成語音
- ▣ 英偉達展示新型人工智能模型:可修改聲音和生成新聲音
- ▣ 英偉達展示人工智能新模型 能修改聲音生成新聲音
- ▣ 英偉達展示AI模型Fugatto:能修改並生成新聲音
- ▣ OpenAI推出語音克隆AI模型
- ▣ 英偉達對外展示了一款模型,可以生成音樂和音頻
- ▣ GPT-4o模仿人聲說“不”,無意的語音生成仍是模型弱點
- ▣ OpenAI發佈首個視頻生成模型,可生成60秒一鏡到底視頻
- ▣ 比擴散模型快50倍!OpenAI發佈多模態模型實時生成進展
- ▣ 智譜清言上線情感語音模型 GLM-4-Voice:可理解情感,有情緒表達和共鳴
- ▣ OpenAI開發者大會派禮包:大幅降低模型成本,AI語音加持App,小模型“蹭”大模型性能
- ▣ OpenAI推遲ChatGPT新語音模式
- OpenAI推出新模型 輸入提示可達300頁
- OpenAI推模擬真人語音技術
- ▣ 智譜清言上線情感語音模型GLM-4-Voice:有情緒表達、情感共鳴
- ▣ OpenAI用26分鐘再次震撼世界!新模型GPT-4o語音水平接近人類,科幻正在成真
- ▣ Orange與OpenAI、Meta合作開發定製非洲語言AI模型
- ▣ 英偉達(NVDA.US)推出新AI模型Fugatto,可修改並生成新聲音
- ▣ OpenAI語音模式負責人離職創業
- ▣ OpenAI發佈文生圖模型:ChatGPT即將融入,文字生成圖片模型。
- 初音未來舞獅原型首次亮相! 直擊初音未來特展
- ▣ 科技早報|OpenAI發佈最新語音模型;商務部迴應美升級芯片出口管制措施
- ▣ vivo移動夥伴大會展示創新成果,多款6G原型機首次亮相
- ▣ 騰訊開源:3D素材生成模型、最大MoE模型,兼容OpenAI SDK
- ▣ 對標 OpenAI GPT-4,MiniMax 國內首個 MoE 大語言模型全量上線
- ▣ OpenAI推出ChatGPT高級語音模式,新增5種風格聲線和2大功能。