日韩免费在线观看成人,骚碰成人免费视频,电影院摸湿嗯…啊h

<span id="um726"><blockquote id="um726"></blockquote></span>

<span id="um726"><blockquote id="um726"></blockquote></span>

<span id="um726"><blockquote id="um726"></blockquote></span>

<span id="um726"><blockquote id="um726"></blockquote></span>

您的位置：首頁>科技 >內(nèi)容

谷歌的DeepMind詢問AI失敗意味著什么

2019-05-08 09:49:17來源：

導(dǎo)讀谷歌的DeepMind詢問AI失敗意味著什么谷歌的DeepMind一直在努力解決如何使神經(jīng)網(wǎng)絡(luò)健壯的問題，但即使理解失敗意味著什么，仍有許多工作要做

谷歌的DeepMind詢問AI失敗意味著什么谷歌的DeepMind一直在努力解決如何使神經(jīng)網(wǎng)絡(luò)“健壯”的問題，但即使理解失敗意味著什么，仍有許多工作要做。有一點(diǎn)可能有所幫助：人類更多地指定成功和失敗的角色。關(guān)于如何使人工智能“強(qiáng)大”地進(jìn)行攻擊并且不易發(fā)生故障的問題已經(jīng)進(jìn)行了多年的研究。然而，正如本周一篇來自谷歌DeepMind部門的博客文章所指出的那樣，人工智能實(shí)際意味著失敗的領(lǐng)域仍然存在。缺失的元素對(duì)于某些人來說似乎是顯而易見的：如果有更多的人參與設(shè)置神經(jīng)網(wǎng)絡(luò)應(yīng)該如何運(yùn)作的邊界條件，那將真的有幫助。

研究人員Pushmeet Kohli，Sven Gowal，Krishnamurthy，Dvijotham和Jonathan Uesato一直在研究這個(gè)問題，他們確定了許多仍有待完成的工作，他們總結(jié)為“走向強(qiáng)大且經(jīng)過驗(yàn)證的AI：規(guī)范測(cè)試，強(qiáng)大的培訓(xùn)”和正式驗(yàn)證。“

計(jì)算機(jī)程序的驗(yàn)證測(cè)試歷史悠久，但這些方法“并不適合現(xiàn)代深度學(xué)習(xí)系統(tǒng)”。

為什么?在很大程度上，因?yàn)榭茖W(xué)家們?nèi)栽诹私馍窠?jīng)網(wǎng)絡(luò)遵循為其規(guī)定的“規(guī)范”意味著什么。并不總是清楚規(guī)范甚至是什么。

作者寫道：“在AI系統(tǒng)中捕獲'正確'行為的規(guī)范通常很難準(zhǔn)確地說明。”

Google的DeepMind提出了一種方法來設(shè)置神經(jīng)網(wǎng)絡(luò)可以產(chǎn)生的輸出類型，以防止它做錯(cuò)事。

DeepMind研究人員觀察到，“規(guī)范”的概念來自軟件世界。它是計(jì)算機(jī)系統(tǒng)的預(yù)期功能。

正如作者在12月的一篇文章中所寫，在AI中，可能不會(huì)只有一個(gè)規(guī)范，可能至少有三個(gè)。有一個(gè)“理想”規(guī)范，系統(tǒng)的創(chuàng)造者想象它可以做什么。然后是“設(shè)計(jì)”規(guī)范，明確針對(duì)神經(jīng)網(wǎng)絡(luò)優(yōu)化的“目標(biāo)函數(shù)”。而且，最后，還有“顯示”規(guī)范，即實(shí)際執(zhí)行的方式。他們稱這三個(gè)規(guī)格，彼此之間可能有很大差異，包括愿望，設(shè)計(jì)和行為。

設(shè)計(jì)人工神經(jīng)網(wǎng)絡(luò)可以看作如何縮小愿望，設(shè)計(jì)和行為之間的差距。正如他們?cè)?2月的文章中寫道的那樣，“當(dāng)理想規(guī)范與顯示的規(guī)范不匹配時(shí)，即當(dāng)人工智能系統(tǒng)沒有做我們希望它做的事情時(shí)，就會(huì)出現(xiàn)規(guī)范問題。”

他們提出了各種測(cè)試和訓(xùn)練神經(jīng)網(wǎng)絡(luò)的途徑，這些網(wǎng)絡(luò)對(duì)錯(cuò)誤更加健壯，并且可能更忠實(shí)于規(guī)范。

一種方法是使用AI本身來弄清楚AI的困惑。這意味著使用像Google的AlphaGo這樣的強(qiáng)化學(xué)習(xí)系統(tǒng)，找到另一種強(qiáng)化學(xué)習(xí)系統(tǒng)失敗的最壞方法?

作者在12月發(fā)表的一篇論文中做到了這一點(diǎn)。“我們學(xué)習(xí)了一種對(duì)抗價(jià)值函數(shù)，它根據(jù)經(jīng)驗(yàn)預(yù)測(cè)哪種情況最有可能導(dǎo)致代理人失敗。”在這種情況下，代理是指強(qiáng)化學(xué)習(xí)代理。

“然后我們使用這種學(xué)習(xí)函數(shù)進(jìn)行優(yōu)化，將評(píng)估重點(diǎn)放在最有問題的輸入上。”他們聲稱該方法導(dǎo)致強(qiáng)化學(xué)習(xí)系統(tǒng)“對(duì)隨機(jī)測(cè)試的大幅改進(jìn)”。

另一種方法是訓(xùn)練神經(jīng)網(wǎng)絡(luò)以避免整個(gè)輸出范圍，以防止它完全脫離軌道并做出非常糟糕的預(yù)測(cè)。作者聲稱，“簡(jiǎn)單邊界技術(shù)”，稱為“區(qū)間界限傳播”，能夠訓(xùn)練“可驗(yàn)證的魯棒”神經(jīng)網(wǎng)絡(luò)。這項(xiàng)工作在去年的NeurIPS大會(huì)上為他們贏得了“最佳論文”獎(jiǎng)。

他們現(xiàn)在正在超越僅僅測(cè)試和訓(xùn)練神經(jīng)網(wǎng)絡(luò)以避免災(zāi)難，他們也開始為保證穩(wěn)健性找到理論基礎(chǔ)。他們認(rèn)為這是一個(gè)“優(yōu)化問題，試圖找到被核實(shí)財(cái)產(chǎn)的最大違規(guī)行為”。

盡管取得了這些成就，但最終還是“需要做很多工作”，作者寫道“構(gòu)建自動(dòng)化工具以確?，F(xiàn)實(shí)世界中的AI系統(tǒng)能夠做出”正確的事情“。

其中一些工作是設(shè)計(jì)能夠更強(qiáng)烈地測(cè)試和訓(xùn)練神經(jīng)網(wǎng)絡(luò)的算法。但其中一些可能涉及人的因素。它是關(guān)于為人類所需的AI設(shè)定目標(biāo) - 目標(biāo)函數(shù)。

“需要建立能夠使用部分人工規(guī)范并從評(píng)估反饋中學(xué)習(xí)更多規(guī)范的系統(tǒng)，”他們寫道，“因?yàn)槲覀冋诮⒛軌蛘宫F(xiàn)復(fù)雜行為并在非結(jié)構(gòu)化環(huán)境中行動(dòng)的越來越智能的代理。”

免責(zé)聲明：本文由用戶上傳，如有侵權(quán)請(qǐng)聯(lián)系刪除！

標(biāo)簽：谷歌

猜你喜歡

最新文章

感谢您访问我们的网站，您可能还对以下资源感兴趣：

日韩免费在线观看成人

<span id="um726"><blockquote id="um726"></blockquote></span>

<span id="um726"><blockquote id="um726"></blockquote></span>