監(jiān)控視頻現(xiàn)在無(wú)處不在,研究人員正在努力讓它變得越來(lái)越智能。最新的發(fā)展是構(gòu)建-或“幻覺”的問(wèn)題-一個(gè)人的完整圖像來(lái)自機(jī)器學(xué)習(xí)ML術(shù)語(yǔ)中的部分或遮擋照片。
當(dāng)您想要查看的對(duì)象或?qū)ο蟊徊迦氲膶?duì)象或?qū)ο蟛糠指采w時(shí),就會(huì)發(fā)生遮擋。紐約時(shí)代廣場(chǎng)表示,在擁擠的公共區(qū)域,監(jiān)控?cái)z像頭很少能一眼看到感興趣的人。
結(jié)果
你可以通過(guò)一些重構(gòu)來(lái)判斷他們的成功——從他們論文中包含的測(cè)試數(shù)據(jù)集。
我印象深刻。
怎么樣
在論文中,作者指出他們對(duì)這個(gè)問(wèn)題采取了一種新的方法。通過(guò)集成最先進(jìn)的神經(jīng)網(wǎng)絡(luò)架構(gòu),即U-net和GAN,以及判別屬性分類網(wǎng)絡(luò),以及專門為去除人體形狀而設(shè)計(jì)的架構(gòu)。
定義是有序的。U-net是一種卷積網(wǎng)絡(luò)架構(gòu),旨在快速準(zhǔn)確地分割生物醫(yī)學(xué)圖像。GAN(生成對(duì)抗網(wǎng)絡(luò))用于無(wú)監(jiān)督機(jī)器學(xué)習(xí),其中兩個(gè)神經(jīng)網(wǎng)絡(luò)在零和博弈的框架下相互競(jìng)爭(zhēng)。判別分類網(wǎng)絡(luò)充當(dāng)質(zhì)量檢查員,消除它可以確定為偽造的生成圖像,只留下欺騙AI的圖像。
如上圖所示,這種組合非常有效。