五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

關(guān)于NaturalSpeech模型的論文解讀以及復(fù)現(xiàn)嘗試(序)

2023-02-28 18:20 作者:ai筆記菌  | 我要投稿

????????NaturalSpeech是微微軟亞洲研究院和微軟 Azure 語(yǔ)音團(tuán)隊(duì)推出的關(guān)于文本生成語(yǔ)音?Text to speech (TTS)的AI合成語(yǔ)音模型。據(jù)說(shuō)在 CMOS 測(cè)試中首次達(dá)到了真人說(shuō)話水準(zhǔn)。

????????這篇文章是UP嘗試復(fù)現(xiàn)論文是所記錄的筆記,希望能夠幫助其他對(duì)TTS感興趣的同學(xué),如果有錯(cuò)誤或不足之處。希望能有大佬在評(píng)論區(qū)指正。閑話就不往下說(shuō)了,開(kāi)始讀論文。

????????跳過(guò)論文中的介紹和其他的一些無(wú)關(guān)內(nèi)容。重點(diǎn)在于模型圖

圖1:NaturalSpeech 系統(tǒng)概覽

看似簡(jiǎn)單,實(shí)際上相當(dāng)復(fù)雜。將它與VITS比較,可以看出,兩者都用了條件變分自編碼器(Variational AutoEncoder,VAE),將高維語(yǔ)音 x 壓縮為幀級(jí)表示 z/ q(z|x))。


圖2:vits 系統(tǒng)概覽

VAE之后,NaturalSpeech接了一個(gè)雙向的先驗(yàn)/后驗(yàn)的flow(沒(méi)錯(cuò)它也用了flow),所以除了一些細(xì)節(jié)上的不同,NaturalSpeech和Vits的框架大差不差,都是VAE+Flow+GAN的模式,而VITS是開(kāi)源的,這就降低了復(fù)現(xiàn)NaturalSpeech的難度。

關(guān)于NaturalSpeech模型的論文解讀以及復(fù)現(xiàn)嘗試(序)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
沁阳市| 苍溪县| 日照市| 钟祥市| 丹阳市| 东乌珠穆沁旗| 绥滨县| 迭部县| 永定县| 肇源县| 耒阳市| 北宁市| 台南县| 望谟县| 尼木县| 江都市| 武义县| 纳雍县| 花垣县| 土默特左旗| 丹寨县| 木里| 宜兴市| 凤凰县| 安泽县| 墨脱县| 神木县| 新安县| 建瓯市| 临泽县| 林甸县| 赫章县| 隆林| 防城港市| 荆州市| 齐齐哈尔市| 福安市| 鄂托克旗| 石屏县| 荥阳市| 常德市|