微軟開源創(chuàng)新音頻模型VibeVoice-1.5B
【資料圖】
今天凌晨,微軟研究院開源了創(chuàng)新音頻模型VibeVoice-1.5B。VibeVoice-1.5B開創(chuàng)了語音界多個(gè)重大技術(shù)突破:一次性可連續(xù)合成90分鐘超長逼真語音,之前多數(shù)模型只能合成60分鐘以內(nèi)語音,并且30分鐘后會(huì)出現(xiàn)音色漂移、語義斷裂等難題。
標(biāo)簽: 財(cái)經(jīng)要聞 實(shí)時(shí)要聞
原標(biāo)題:微軟開源創(chuàng)新音頻模型VibeVoice-1.5B
>更多相關(guān)文章
-
無相關(guān)信息
熱門推薦
酷圖美文











