日韩免费在线观看成人,骚碰成人免费视频,电影院 摸 湿 嗯…啊h

    1. <span id="um726"><blockquote id="um726"></blockquote></span>

        <span id="um726"><blockquote id="um726"></blockquote></span>
        1. 您的位置:首頁(yè)>國(guó)際 >內(nèi)容

          人造聲音開始聽起來就像人類一樣

          2019-04-01 09:37:30來源:
          導(dǎo)讀舊金山(CNN商業(yè))它可能是YouTube上的任何廣告:一個(gè)金發(fā)碧眼的模特俏皮地將她的手放在鏡頭前,戴著白色太陽(yáng)鏡并閃爍著笑容。在背景中,嘻哈

          舊金山(CNN商業(yè))它可能是YouTube上的任何廣告:一個(gè)金發(fā)碧眼的模特俏皮地將她的手放在鏡頭前,戴著白色太陽(yáng)鏡并閃爍著笑容。在背景中,嘻哈音樂播放,而一個(gè)明確無誤的女性聲音說,“時(shí)尚變化,但風(fēng)格永遠(yuǎn)持續(xù)。”

          廣告 -由一家名為WellSaid Labs的新創(chuàng)業(yè)公司創(chuàng)建的YouTube上的演示卷軸的一部分- 簡(jiǎn)短而光滑。但有些事情有點(diǎn)不同。雖然您看到的模型是人類,但您聽到的背景聲音聽起來只有一個(gè)。

          這家總部位于西雅圖的公司正在使用配音演員和人工智能來制作聽起來像人一樣的合成聲音。該公司聲稱,過去一年中一直在研究的文本到語音轉(zhuǎn)換軟件可以產(chǎn)生聽起來比其他合成聲音更像人類的音頻。據(jù)該公司稱,其原因在于,在訓(xùn)練語音模型時(shí),它并沒有嚴(yán)格控制語音的不同變量,如速度,發(fā)音和音量。

          WellSaid Labs首席執(zhí)行官M(fèi)att Hocking告訴美國(guó)有線電視新聞網(wǎng)(CNN Business),“我們?cè)谶@里努力創(chuàng)造的聲音在其最終結(jié)果中表現(xiàn)得極具表現(xiàn)力和栩栩如生。”

          這些人不存在。 為什么網(wǎng)站會(huì)制作人(和貓)的虛假圖像

          這些人不存在。為什么網(wǎng)站會(huì)制作人(和貓)的虛假圖像

          如今,計(jì)算機(jī)化的聲音似乎無處不在,從您客廳的智能揚(yáng)聲器中提供新聞,或者在車內(nèi)為您提供轉(zhuǎn)彎指示。然而,Alexa,Siri,Google智能助理以及其他您可能會(huì)聽到的人仍然傾向于發(fā)出尖銳的機(jī)器人聲音。(值得注意的例外是,Google Duplex可以通過令人印象深刻的人性化AI啟用語音呼叫一些企業(yè)進(jìn)行預(yù)訂; Google正在越來越多地使用它,但您必須接聽電話的接收端 - 在例如,一家餐館 - 聽一聽。

          WellSaid Labs并不打算接管語音助理市場(chǎng)。相反,Hocking說,它希望將聲音賣給想要在廣告,營(yíng)銷和電子學(xué)習(xí)課程中使用它們的公司。

          該公司表示,它正在構(gòu)建一些客戶可以使用的類似人類的聲音,并希望與配音演員合作創(chuàng)建可用于創(chuàng)建各種人工聲音的不同數(shù)據(jù)集。

          你可能聽說過照片;你可能會(huì)認(rèn)為這是股票的聲音。

          為了讓女性在人造廣告中發(fā)聲,WellSaid Labs首先讓一位配音演員閱讀維基百科的文章。這些記錄形成了一個(gè)數(shù)據(jù)集,用于訓(xùn)練人工神經(jīng)網(wǎng)絡(luò) - 一種計(jì)算系統(tǒng),其結(jié)構(gòu)在大腦神經(jīng)元之后松散地建模。

          另一個(gè)在線演示展示了人工智能產(chǎn)生的聲音與演員之間的相似之處,兩個(gè)幾乎無法區(qū)分的聲音交替出現(xiàn) - 一個(gè)是人類配音演員,一個(gè)是人工智能產(chǎn)生的聲音 - 聽起來像一個(gè)中年女人。您可能偶爾會(huì)注意到一些差異,但它們很輕微;例如,你所期望的重點(diǎn)可能只是一句話。

          該創(chuàng)業(yè)公司表示,它不需要預(yù)先處理或注釋給予軟件的文本,因?yàn)樗軌蛞宰匀坏姆绞綇?qiáng)調(diào)詞語 - 這是人工語音很難在沒有幫助的情況下完成的事情(雖然谷歌等公司一直致力于此。如果你將相同的文本輸入其文本到語音生成器兩次,你會(huì)得到不同的結(jié)果。

          首席技術(shù)官M(fèi)ichael Petrochuk說,現(xiàn)在渲染一行文字大約需要四秒鐘。然而,該模型并不是為了解釋長(zhǎng)文本而構(gòu)建的:它可以用來說幾個(gè)句子,但是,例如,整個(gè)CNN商業(yè)文章的文本需要在分析之前切成碎片。由WellSaid Labs的聲音說出來。(該公司的一個(gè)聲音說出了這個(gè)故事的標(biāo)題和第一段 -聽一聽,看看你的想法。)

          這個(gè)AI非常擅長(zhǎng)寫作,它的創(chuàng)作者不會(huì)讓你使用它

          很難使合成聲音始終保持良好狀態(tài)??▋?nèi)基梅隆大學(xué)語言技術(shù)教授艾倫·布萊克說,我們熟悉的那些,比如亞馬遜的Alexa,都是機(jī)器人聲音,因?yàn)樵谒星闆r下讓它聽起來都很自然。他說,要向語音合成器提供適量的信息是很困難的,因此它可以用恰當(dāng)?shù)母杏X做出反應(yīng)。

          “我們的合成器上沒有一個(gè)小旋鈕可以說'感覺87%',”他說。

          他聽了一些WellSaid Labs的演示聲音,并認(rèn)為他們聽起來“相當(dāng)不錯(cuò)”。

          但是,如果人類的聲音聽起來接近 - 或者與人類無法區(qū)分,那么聽眾應(yīng)該知道他們不是在聽真人談話嗎?在谷歌于2018年展示Duplex之后,人們發(fā)出了人性化的AI向?yàn)硡^(qū)餐廳發(fā)出的聲明,該科技公司被批評(píng)為沒有人工智能透露它是什么。

          Black認(rèn)為披露是不必要的,至少在廣告的背景下是這樣。

          “我認(rèn)為,一般來說,大多數(shù)人都相對(duì)意識(shí)到他們?cè)谝曨l和音頻中所看到的東西在某種意義上是處理過的,”他說。“他們知道,當(dāng)他們觀看'指環(huán)王'時(shí),新西蘭真的沒有很多獸人出現(xiàn)在電影中

          免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

          猜你喜歡

          最新文章