教電腦如何編織有什么意義?麻省理工學(xué)院的研究人員發(fā)現(xiàn),它不僅僅是一些漂亮的手套和圍巾,而是一個(gè)深入學(xué)習(xí)人工智能的窗口。近年來人工智能的一個(gè)熱門趨勢是令人印象深刻的假貨的興起 - 假爆頭,假視頻,假文本。作為機(jī)器學(xué)習(xí)的一部分,深度學(xué)習(xí)技術(shù)在獲取真實(shí)世界數(shù)據(jù)方面變得越來越好,并且使用它來制作人工制作的東西,例如圖片,看起來令人難以置信。
周一麻省理工學(xué)院的研究人員宣布了一種相反方向的人工智能方法:它需要一些真實(shí)的東西,并使其變得人為。該應(yīng)用程序有些令人驚訝,需要復(fù)制的針織服裝。該系統(tǒng)研究服裝的圖片并計(jì)算一系列縫線以給予自動(dòng)針織機(jī)。
根據(jù)好奇的標(biāo)題“ 神經(jīng)逆編織:從圖像到制造說明 ”,本文描述了如何拍攝針織服裝的圖像,并使用卷積神經(jīng)網(wǎng)絡(luò)或CNN,以及生成對(duì)抗網(wǎng)絡(luò)(GAN)來制作平面圖或藍(lán)圖,指定服裝中的每個(gè)點(diǎn)應(yīng)使用十七種不同的針跡類型。該論文由亞歷山大·卡斯帕爾,Tae-Hyun Oh,Liane Makatura,Petr Kellnhofer和麻省理工學(xué)院的Wojciech Matusik撰寫。
該研究結(jié)合第二篇論文“ 編織骷髏:用于針織服裝成型和圖案化的計(jì)算機(jī)輔助設(shè)計(jì)工具 ”,其中Kaspar,Makatura和Matusik介紹了一個(gè)軟件程序,可以輕松布置針跡圖案一件衣服。
MIT-神經(jīng)編織數(shù)據(jù) - 組 - examples.png
深層針織管道,從左邊的服裝和地面真實(shí)標(biāo)簽的真實(shí)照片到右側(cè)網(wǎng)絡(luò)產(chǎn)生的推斷針跡圖案。
MIT
第二篇論文的想法是一種軟件工具,這使得沒有針織經(jīng)驗(yàn)的人可以非常容易地為自動(dòng)編織機(jī)生產(chǎn)說明書。自動(dòng)編織機(jī)已經(jīng)激增,例如Shima Seiki的系統(tǒng)。但是他們通常需要一些領(lǐng)域?qū)I(yè)知識(shí)才能進(jìn)行編程,因此Kaspar及其同事希望通過簡化設(shè)計(jì)流程為新手提供一種方法。這與“增材制造”的情況非常相似,人們可以將他們的設(shè)計(jì)上傳到云中的3D打印機(jī)。在這里,麻省理工學(xué)院的作者希望推進(jìn)“針織即服務(wù)”,就像他們所說的那樣。
這有助于避免針織機(jī)的“機(jī)器編碼”,但仍然需要做大量工作來指定服裝中的所有針跡。這就是機(jī)器學(xué)習(xí)變得有趣的地方。他們提出了一種自動(dòng)生成機(jī)器可理解針跡模式的算法。
另外:Nvidia的神話般的假貨打開了黑盒子的AI
“在整個(gè)服裝編織機(jī)的操作過程中,他們執(zhí)行一個(gè)定制的低級(jí)程序來制造每個(gè)紡織品,”他們?cè)?ldquo;神經(jīng)逆向針織”中解釋道。
“通常,生成與每個(gè)設(shè)計(jì)相對(duì)應(yīng)的代碼是一個(gè)困難而繁瑣的過程,需要專業(yè)知識(shí)。”
神經(jīng)逆編織網(wǎng)絡(luò),具有結(jié)合真實(shí)照片和服裝合成照片的“精煉者”,以及輸出機(jī)器可讀針跡指令的程序生成器。
MIT
因此,需要使用機(jī)器學(xué)習(xí)來開發(fā)從樣衣服裝開始自動(dòng)計(jì)算出這樣的機(jī)器指令的能力,你可以稱之為“計(jì)算編織”。
如在包含補(bǔ)充材料的論文中詳細(xì)描述的那樣,神經(jīng)網(wǎng)絡(luò)必須計(jì)算兩個(gè)不同的東西:它必須首先計(jì)算所討論的服裝的理想表示,然后它必須計(jì)算所涉及的針腳。
對(duì)于第一部分,神經(jīng)網(wǎng)絡(luò)被送入兩種樣本,即作者從頭開始編織然后拍攝的針織服裝的真實(shí)照片; 并合成由他們的設(shè)計(jì)軟件生成的服裝圖像。后者,合成圖像,比真實(shí)世界的照片更清潔,因此它們將用于清理現(xiàn)實(shí)世界中的圖像。
另外:麻省理工學(xué)院提高了一個(gè)AI來教另一個(gè)人的賭注
使用生成對(duì)抗網(wǎng)絡(luò)或GAN的“精煉者”模塊融合真實(shí)和合成圖像,并通過根據(jù)編織圖案的理想化,正則化合成圖像對(duì)其進(jìn)行變換來清理真實(shí)圖像。
正如作者所描述的那樣,它們正在扭轉(zhuǎn)GAN的典型用途,GAN試圖將虛假的東西“映射”到真實(shí)的東西,以產(chǎn)生令人信服的傳真。在這里,他們反而希望用模擬的東西簡化和澄清現(xiàn)實(shí)世界的混亂。
他們寫道:“之前的方法已經(jīng)研究過生成逼真的圖像。” “我們學(xué)會(huì)通過從真實(shí)數(shù)據(jù)到合成外觀數(shù)據(jù)的映射來中和現(xiàn)實(shí)世界的擾動(dòng)。” 通過消融研究,他們表明,與僅僅使用針織物品的真實(shí)照片相比,在計(jì)算所涉及的針跡時(shí),真實(shí)和合成圖像的組合會(huì)更好。
作者從頭開始編織了一些樣品并將它們拉伸在金屬棒上,這樣他們就可以拍攝它們來構(gòu)建真實(shí)世界圖像的數(shù)據(jù)集來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
第二部分稱為“Img2Prog”,用于從真實(shí)和合成圖像的混合中導(dǎo)出針跡。兩組圖像都標(biāo)有“地面實(shí)況”標(biāo)簽,表示在圖像中看到17個(gè)針跡圖案中的哪一個(gè)。通過優(yōu)化地面實(shí)況標(biāo)簽和神經(jīng)網(wǎng)絡(luò)輸出之間的“交叉熵”損失,神經(jīng)網(wǎng)絡(luò)計(jì)算在數(shù)千個(gè)示例圖像中表示的17種不同針腳的統(tǒng)計(jì)模式。
機(jī)器學(xué)習(xí),任務(wù)自動(dòng)化和機(jī)器人技術(shù)已經(jīng)廣泛應(yīng)用于商業(yè)領(lǐng)域。這些和其他人工智能技術(shù)即將繁衍,我們將研究組織如何最好地利用它們。
所有這些都與機(jī)器學(xué)習(xí)的其他領(lǐng)域有一些有趣的聯(lián)系。作者寫道,他們正在做的事情類似于“語義分割”,其中機(jī)器學(xué)習(xí)算法被訓(xùn)練以挑選場景中的對(duì)象。“這類似于每像素多類別分類問題的語義分割,”他們寫道,但有一個(gè)重要的區(qū)別:“語義分割對(duì)于人類來說是一項(xiàng)簡單而繁瑣的任務(wù),而解析編織指令則需要大量的專業(yè)知識(shí)或者逆向工程。”
更具挑釁性的是作者斷言他們的工作類似于“程序綜合”,其中神經(jīng)網(wǎng)絡(luò)用于構(gòu)建計(jì)算機(jī)程序。
“在返回明確的可解釋程序方面,我們的工作與程序綜合密切相關(guān),這是一個(gè)具有挑戰(zhàn)性的持續(xù)性問題,”他們寫道。
“我們的任務(wù)有可能擴(kuò)展該領(lǐng)域的研究范圍,因?yàn)樗c程序綜合的任何其他先前任務(wù)的不同之處在于:1)當(dāng)程序綜合解決方案采用序列生成范例時(shí),我們的輸入 - 輸出對(duì)類型是2D程序地圖,2)新開發(fā)的領(lǐng)域?qū)S谜Z言,適用于實(shí)用編織。“
你有它:從可區(qū)分的針織帽和手套到可區(qū)分的計(jì)算機(jī)代碼。