久热这里只有精-久热这里只精品99国产6_99-久热这里有精品-久热这里都是精品-久热这里-久热影视

 
當(dāng)前位置: 首頁(yè) » 行業(yè)資訊 » 機(jī)器人»機(jī)器人的面孔 天使的聲音;
   

機(jī)器人的面孔 天使的聲音;

 46.1K
     [點(diǎn)擊復(fù)制]
放大字體  縮小字體 發(fā)布日期:2016-09-13   瀏覽次數(shù):362
核心提示:近日,谷歌旗下人工智能公司DeepMind公布了其在計(jì)算機(jī)語音合成領(lǐng)域的最新研究突破WaveNet。WaveNet是一種利用神經(jīng)網(wǎng)絡(luò)系統(tǒng)對(duì)原始
      近日,谷歌旗下人工智能公司DeepMind公布了其在計(jì)算機(jī)語音合成領(lǐng)域的最新研究突破——WaveNet。WaveNet是一種利用神經(jīng)網(wǎng)絡(luò)系統(tǒng)對(duì)原始音頻波形(RawSoundWave)建模的技術(shù),生成的音頻質(zhì)量?jī)?yōu)于目前所有的文本轉(zhuǎn)語音(Text-to-Speech,TTS)系統(tǒng),將計(jì)算機(jī)輸出音頻與人類自然語音差距縮小50%,號(hào)稱世界最佳!

  DeepMind在twitter發(fā)文稱:“讓人類和機(jī)器對(duì)話是人機(jī)交互領(lǐng)域長(zhǎng)久以來的夢(mèng)想!”

  通常我們聽到的計(jì)算機(jī)或手機(jī)輸出的文本轉(zhuǎn)語音(TTS)音頻都會(huì)覺得別扭、生硬,甚至詭異。此次DeepMind推出的這款新型語音合成系統(tǒng)WaveNet將大大改善這種情況,讓機(jī)器輸出音頻更自然、更像人類發(fā)聲。

  當(dāng)然,讓計(jì)算機(jī)發(fā)出聲音,這并不是什么新鮮事兒。

  最常用的TTS方法可能是拼接式語音合成(ConcatenativeSynthesis):先錄制單一說話者的大量語音片段,建立一個(gè)大型語料庫(kù),然后簡(jiǎn)單地從中進(jìn)行選擇并合成完整的大段音頻、詞語和句子。這種“機(jī)械式”方法使得計(jì)算機(jī)輸出音頻經(jīng)常產(chǎn)生語音毛刺、語調(diào)的詭異變化、甚至結(jié)巴,并且無法調(diào)整語音的強(qiáng)調(diào)性音節(jié)或情緒。

  另外一種方法是所謂的參數(shù)化方法,利用數(shù)學(xué)模型對(duì)已知的聲音進(jìn)行排列、組裝成詞語或句子來重新創(chuàng)造音頻。這種技術(shù)倒是不易產(chǎn)生聲音毛刺,所以確實(shí)讓機(jī)器輸出的音頻聽起來不那么機(jī)器化。

  然而,這兩種技術(shù)的共同點(diǎn)是:簡(jiǎn)單、機(jī)械地將語音片段拼接起來,而不是從零開始創(chuàng)造出整個(gè)音頻波形。
   WaveNet正是一種從零開始創(chuàng)造整個(gè)音頻波形輸出的技術(shù)。
  WaveNet利用真實(shí)的人類聲音剪輯和相應(yīng)的語言、語音特征來訓(xùn)練其卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetworks),讓其能夠辨別這兩方面(語言和語音)的音頻模式。使用中,對(duì)WaveNet系統(tǒng)輸入新的文本信息,也即相對(duì)應(yīng)的新的語音特征,WaveNet系統(tǒng)會(huì)重新生成整個(gè)原始音頻波形來描述這個(gè)新的文本信息。

  WaveNet組織結(jié)構(gòu)

  WaveNet是逐步進(jìn)行操作的:首先,生成一個(gè)音頻波形樣本;接著再處理、生成一個(gè)音頻波形樣本,逐步進(jìn)行。其中非常重要的是,新的樣本生成都會(huì)受到此前樣本結(jié)果的影響,也即每一步的樣本結(jié)果都將影響下一步的樣本預(yù)測(cè),并幫助生成下一步的樣本。

  最終的音頻結(jié)果確實(shí)表現(xiàn)驚人(試聽參照DeepMind網(wǎng)站:https://deepmind.com/blog/wavenet-generative-model-raw-audio/)。相比于連續(xù)合成和參數(shù)化合成技術(shù),WaveNet輸出音頻明顯更接近自然人聲。

  DeepMind的WaveNet技術(shù)無疑是計(jì)算機(jī)語音合成領(lǐng)域的一大突破。然而,由于WaveNet是計(jì)算整個(gè)原始音頻波形,每輸出一秒音頻神經(jīng)網(wǎng)絡(luò)必須處理16000個(gè)樣本,所以WaveNet技術(shù)需要強(qiáng)大的運(yùn)算能力來合成語音。

  據(jù)DeepMind透露給《金融時(shí)報(bào)》(FinancialTimes)的內(nèi)部消息稱,這意味著目前還不能應(yīng)用于谷歌或其他的任何一項(xiàng)產(chǎn)品中。

  然而,這并不是計(jì)算機(jī)面臨的唯一語言問題。翻譯自然語言和手寫文字也是人工智能系統(tǒng)的一大難題。

  起碼以現(xiàn)在這速度,在計(jì)算機(jī)形成真正的智能思考能力之前,它們應(yīng)該早就能夠用花哨的語言和人類交流了。 

 
 
 
[ 行業(yè)資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關(guān)閉窗口 ]
 
 
展會(huì)更多+
視頻更多+
點(diǎn)擊排行
 
網(wǎng)站首頁(yè) | 網(wǎng)站地圖 | 排名推廣 | 廣告服務(wù) | 積分換禮 | 網(wǎng)站留言 | RSS訂閱
主站蜘蛛池模板: www.爱操| 亚洲AV久久无码精品蜜桃 | 色老板在线免费视频 | 四虎b7s22c0m | 欧美视频一二三区 | 91交换论坛 | 韩国情事伦理片观看地址 | 俄罗斯处女 | 四虎影视4hutv最新地址在线 | 2020年最新国产精品视频免费 | 短篇小说肉 | 深夜激情网 | 日本连裤袜xxxxx在线视频 | free性丰满hd性欧美厨房 | 天天爱天天操天天射 | 毛片小视频 | 亚洲男人第一天堂 | 免费高清资源黄网站在线观看 | 午夜宅男宅女看在线观看 | 久久精品视在线观看85 | 免费在线观看网址大全 | 午夜片神马影院福利 | 成人免费毛片一区二区三区 | ffee性xxⅹ另类老妇hd | 91yellow吧字幕网zmff7 | 色小孩导航 | 99精品国产成人一区二区在线 | 欧美图片另类小说综合 | 免费日批软件 | 91国产在线观看 | 亚欧精品在线观看 | 236宅宅2021最新理论 | 国产精品一区二区三区久久 | 日本一区二区在线不卡 | 国产午夜精品久久久久小说 | 亚洲狼人综合干 | 美女脱了内裤让男生尿囗 | 国产成人在线播放 | 末发育xxxxx仙踪林 | 韩国美女被的免费视频 | 国产香蕉一区二区在线网站 |