楊凈 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
一個(gè)OpenAI華人大牛,最近引發(fā)眾人關(guān)注。
他剛以一作身份發(fā)表的最新生成模型,引爆整個(gè)學(xué)術(shù)圈,讓不少人驚呼:
有望「終結(jié)擴(kuò)散模型」,「圖像生成領(lǐng)域,要變天了」。
他提出的一致性模型,效果比擴(kuò)散模型更快更好——只需3.5秒就能生成張左右256×256的圖像。
而在此之前,同樣也是因?yàn)樗墓ぷ?,才有了之?strong>擴(kuò)散模型的狂潮——
DALL-E 2、Stable Diffusion、Imagen等的出現(xiàn)。
這位名叫宋飏的機(jī)器學(xué)習(xí)研究員,親身參與著圖像生成領(lǐng)域的關(guān)鍵性變革。
但不為多數(shù)人所知的是,他曾16歲裸分上清華,原本是想當(dāng)一名物理學(xué)家。
他曾這樣形容兩者之間的關(guān)系:
有很多技術(shù)最初是由物理學(xué)家發(fā)明的,現(xiàn)在在機(jī)器學(xué)習(xí)中非常重要。
OpenAI華人大牛
從個(gè)人網(wǎng)站上顯示, 目前他在OpenAI致力于開(kāi)發(fā)可擴(kuò)展的方法來(lái)建模、分析和生成復(fù)雜的高維數(shù)據(jù)。
主要研究興趣涵蓋多個(gè)領(lǐng)域,包括生成建模、表示學(xué)習(xí)、概率推理、人工智能安全性以及AI for Science。
而他的最終目標(biāo)也在網(wǎng)站上提及:
- 解決具有廣泛意義的問(wèn)題,開(kāi)發(fā)既易于理解又有效的方法, 并構(gòu)建可以改善人類(lèi)生活的智能系統(tǒng)。
他的最新論文一致性模型,在學(xué)術(shù)圈引起了巨大的反響。
有網(wǎng)友實(shí)測(cè)發(fā)現(xiàn),只需要3.5秒左右就能生成張左右256×256的圖像:
- 游戲結(jié)束!
這種圖像生成領(lǐng)域的顛覆性,對(duì)于宋飏本人來(lái)說(shuō)可能并不陌生。
來(lái)到OpenAI之前,他曾在斯坦福大學(xué)攻讀計(jì)算機(jī)博士,研究包括基于分?jǐn)?shù)的生成模型(Score-Based Diffusion models)和擴(kuò)散模型,師從Stefano Ermon。
Stefano Ermon是斯坦福計(jì)算機(jī)系副教授,隸屬于人工智能實(shí)驗(yàn)室,也是伍茲環(huán)境研究所的研究員。
(值得一提的是,OpenAI不少研究員也師出同門(mén),比如負(fù)責(zé)ChatGPT訓(xùn)練的Shengjia Zhao,本科同樣畢業(yè)于清華)
其團(tuán)隊(duì)連續(xù)兩年獲得ICLR杰出論文獎(jiǎng),其中一次一作正是宋飏。
- 使用隨機(jī)微分方程進(jìn)行基于分?jǐn)?shù)的生成建模。
他們提出了一種全新的方式來(lái)解決基于分?jǐn)?shù)生成模型的逆向問(wèn)題,最終在CIFAR-10上實(shí)現(xiàn)了破紀(jì)錄的無(wú)條件圖像生成性能,并首次在這種生成模型中證明了高分辨率(1024?1024)圖像的高保真生成。
而要被視作為Diffusion Model提供早期貢獻(xiàn)的,還要屬被NeurIPS 2019 接收并做口頭報(bào)告的工作。
當(dāng)時(shí),GAN還在以逼真生成風(fēng)格席卷全球,但眾多科學(xué)家仍受困于很難訓(xùn)練、無(wú)法完整采樣等難題。
斯坦福大學(xué)博士后Sohl-Dickstein受到物理學(xué)啟發(fā),利用擴(kuò)散原理開(kāi)發(fā)了生成建模算法——類(lèi)似于從一滴墨水變成漫射淡藍(lán)色的水,首先將訓(xùn)練數(shù)據(jù)集中的復(fù)雜圖像轉(zhuǎn)化為簡(jiǎn)單的噪聲,然后教系統(tǒng)如何反轉(zhuǎn)這個(gè)過(guò)程,將噪聲轉(zhuǎn)化為圖像。
雖然可以對(duì)整個(gè)分布進(jìn)行采樣,但性能效果仍遠(yuǎn)遠(yuǎn)落后于GAN,訓(xùn)練過(guò)程也太慢。
這時(shí)候,宋飏和他的導(dǎo)師出現(xiàn)了。他們提出了一種新方法,不估計(jì)數(shù)據(jù)的概率分布,而是估計(jì)分布的梯度,最終效果實(shí)現(xiàn)了對(duì)GAN的超越。
宋飏坦言:當(dāng)時(shí)根本不知道擴(kuò)散模型。是在論文發(fā)表之后,收到了Sohl-Dickstein的郵件,稱(chēng)與擴(kuò)散模型有非常緊密的聯(lián)系。
此后,更多人在此基礎(chǔ)上進(jìn)行了更新和迭代,才有了擴(kuò)散模型的驚艷效果。
或許在此之前,宋飏怎么也不會(huì)想到,這場(chǎng)Diffusion Model風(fēng)潮竟受到物理啟發(fā),還會(huì)與自己有關(guān)。
16歲就當(dāng)理科狀元上清華
早在高中的時(shí)候,宋飏就展現(xiàn)了他在物理和信息學(xué)方面的天賦。
當(dāng)時(shí)他在江蘇省新海高級(jí)中學(xué),就獲得了全國(guó)物理奧賽、信息學(xué)奧賽的一等獎(jiǎng),并且還成功當(dāng)選第一年清華大學(xué)“新百年領(lǐng)軍計(jì)劃”校長(zhǎng)推薦人。
據(jù)稱(chēng),這放在連云港市,也是全市第一人。
當(dāng)時(shí)清華推薦生面試現(xiàn)場(chǎng),一段“樸實(shí)無(wú)華”的自我介紹就讓當(dāng)場(chǎng)所有人都記住了他。
- 我是奧賽宋飏,我獲得了物理以及信息學(xué)的全國(guó)一等獎(jiǎng);我是標(biāo)兵宋飏,我的理想是做一名物理學(xué)家,現(xiàn)在我已經(jīng)自學(xué)了高校里的高等數(shù)學(xué)以及普通物理學(xué);我還是文藝宋飏,我已經(jīng)通過(guò)了鋼琴十級(jí)答案,在班級(jí)的羽毛球?qū)官惿希灿形一钴S的身影。
最終全票通過(guò),當(dāng)上了清華推薦生。但他有一個(gè)flag:裸分上清華。
于是在第二年,以425分獲得當(dāng)年連云港市的理科狀元,順利進(jìn)入到了清華大學(xué)數(shù)理基礎(chǔ)科學(xué)班,師從朱軍、Raquel Urtasun、Richard Zemel等大佬。
對(duì)于這個(gè)成績(jī),當(dāng)時(shí)他也沒(méi)有想到:我覺(jué)得也就在400分左右吧,完全出乎意料。
據(jù)當(dāng)時(shí)揚(yáng)子晚報(bào)消息,每次考完試時(shí),就經(jīng)常找老師們聊天談心。在學(xué)校里考得最差的一次是年級(jí)40多名。
除了學(xué)校和老師的幫助,家庭的氛圍也對(duì)他的成長(zhǎng)密不可分。年幼時(shí)父母晚飯后就不看電視,而是各自拿著一本書(shū)在看。在這種氛圍中,宋飏也坐在書(shū)桌旁閱讀各類(lèi)書(shū)籍。
現(xiàn)在,他也有了最新動(dòng)向:
2024年1月開(kāi)始,他將加入加州理工學(xué)院電子系(EE)和計(jì)算數(shù)學(xué)科學(xué)系(CMS)擔(dān)任助理教授。
參考鏈接:
[1]http://.xhgz.com/show-10-783-1.html
[2]https://news.sina.com.cn/o/2012-06-25/0525249267.shtml
[3]https://baike.sogou.com/v63765572.htm
[4]https://yang-song.net/
[5]https://tieba.baidu.com/p/12799102
[6]https://.quantamagazine.org/the-physics-principle-that-inspired-modern-ai-art-20230105/