出品|網(wǎng)易科技《智見(jiàn)訪(fǎng)談》
訪(fǎng)談|楊霞清
撰文|趙芙瑤
編輯|丁廣勝
繼工業(yè)革命后,GPT及其GPT所引發(fā)的AIGC能否成為下一個(gè)人類(lèi)社會(huì)變革的新奇點(diǎn)?
一批又一批的AIGC工具正在不斷迸發(fā)出超乎尋常的能力,GPT-4可以聯(lián)網(wǎng)并安裝插件后可以一站式成為人們的私人助理;谷歌Bard幫程序員寫(xiě)完代碼后同時(shí)能助力其與國(guó)外同事無(wú)語(yǔ)言障礙共同進(jìn)行代碼調(diào)試;微軟New Bing讓搜索引擎變身無(wú)所不知的“哆啦A夢(mèng)”;Midjourney和Stable Diffusion的作圖能力令人嘆為觀止...AI正在以幾何式的速度塔上了特快列車(chē)。
如何看AIGC發(fā)展的趨勢(shì),AI安全問(wèn)題該如何規(guī)避,中國(guó)的大模型在國(guó)外的差距在哪方面?日前,網(wǎng)易科技《智見(jiàn)》欄目訪(fǎng)談了浙江大學(xué)上海高等研究院常務(wù)副院長(zhǎng)、浙江大學(xué)人工智能研究所所長(zhǎng)吳飛。吳飛認(rèn)為,這波以生成式人工智能模型為基礎(chǔ)的AIGC之所以取得了突破在于將“數(shù)據(jù)是燃料、模型是引擎和算力是加速器”進(jìn)行了完美結(jié)合,產(chǎn)生了令人驚嘆概率式內(nèi)容合成能力。但是這一技術(shù)創(chuàng)新被稱(chēng)為現(xiàn)象級(jí)人工智能產(chǎn)品,即大眾可以看到其成果,但解釋其背后的機(jī)理仍然困難。所謂“我見(jiàn)、我相信,但我不理解”。
目前,對(duì)于AI的發(fā)展大多存在兩種較為對(duì)立觀點(diǎn):第一種是機(jī)器作為人類(lèi)的助手與人類(lèi)共生共進(jìn)化,另一種是機(jī)器逐漸取代人類(lèi),使人類(lèi)成為機(jī)器的奴役對(duì)象。吳飛認(rèn)同第一種觀點(diǎn),他認(rèn)為第二種擔(dān)憂(yōu)在科幻電影中就曾展現(xiàn)過(guò)。但總體而言,機(jī)器產(chǎn)生意識(shí)和涌現(xiàn)情感在技術(shù)手段上而言,這一目標(biāo)實(shí)現(xiàn)相距甚遠(yuǎn)。
談及人工智能的監(jiān)管,吳飛認(rèn)為,2016年制定的《新一代人工智能發(fā)展規(guī)劃》中就提及到了人工智能的監(jiān)管,特別是數(shù)據(jù)隱私保護(hù)和大數(shù)據(jù)濫用等方面。
以下是網(wǎng)易科技訪(fǎng)談吳飛教授訪(fǎng)談實(shí)錄:
談AI演進(jìn):ChatGPT具有現(xiàn)象級(jí)“涌現(xiàn)”能力
網(wǎng)易科技:您如何看待今年以來(lái)AIGC和ChatGPT的爆火?
吳飛:人工智能的發(fā)展歷程可以追溯到1955年,彼時(shí),它的目標(biāo)是通過(guò)戰(zhàn)勝各領(lǐng)域頂尖專(zhuān)家來(lái)展示其能力。人工智能當(dāng)時(shí)在圍棋、國(guó)際象棋等方面表現(xiàn)出色。過(guò)去,只有像IBM、微軟、網(wǎng)易、騰訊等大型科技公司才能接觸人工智能,普通民眾對(duì)其了解有限。
然而,如今ChatGPT的爆火,讓普通民眾也可以使用人工智能,無(wú)需掌握復(fù)雜的計(jì)算機(jī)系統(tǒng)編程,只需通過(guò)自然語(yǔ)言交互就能完成諸如寫(xiě)代碼、寫(xiě)文章或旅行規(guī)劃等任務(wù)。ChatGPT讓人們感到離人工智能的距離越來(lái)越近。
ChatGPT之所以能生成完整的句子,是因?yàn)槟P椭幸胱⒁饬C(jī)制,從海量語(yǔ)料中學(xué)習(xí)單詞和單詞之間的共現(xiàn)關(guān)聯(lián)概率,形成單詞概率相聯(lián)圖譜,于是在這個(gè)單詞圖譜上就可以實(shí)現(xiàn)內(nèi)容合成。例如,合成"浙江大學(xué)的校訓(xùn)是求是創(chuàng)新"這一句子時(shí),模型通過(guò)概率判斷句子中前一個(gè)單詞與后一個(gè)單詞概率最大,于是在得到前一個(gè)單詞時(shí),接著生成后一個(gè)單詞,這個(gè)句子中的單詞就通過(guò)概率游走方式被產(chǎn)生,實(shí)現(xiàn)了連詞成句和連詞成篇的效果。這樣生成的內(nèi)容通常具有合情合理性,因?yàn)椤按嬖诩春侠怼保浜铣傻慕Y(jié)果來(lái)源于對(duì)現(xiàn)實(shí)世界數(shù)據(jù)的信息壓縮和信息解壓。
網(wǎng)易科技:人工智能有60多年歷史了,今年的AIGC浪潮和之前的人工智能浪潮有什么不同?有哪些突破和創(chuàng)新?
吳飛:這波人工智能的進(jìn)步主要是工程層面上的持續(xù)艱苦創(chuàng)新,通過(guò)將海量的數(shù)據(jù)、龐大的模型和計(jì)算系統(tǒng)整合在一起。這種工程創(chuàng)新在以往是沒(méi)有人能夠?qū)崿F(xiàn)的,例如如何對(duì)上萬(wàn)張GPU/CPU之間的數(shù)據(jù)和指令通信進(jìn)行同步和異步的協(xié)同。這種工程性的創(chuàng)新使得人工智能可以展現(xiàn)出現(xiàn)象級(jí)的能力,即大眾可以看到其成果,但解釋其背后的機(jī)理仍然困難。
而人工智能的突破則在于將數(shù)據(jù)、模型和算力相結(jié)合,產(chǎn)生了令人驚嘆的能力。然而,我們對(duì)于其為何具備如此強(qiáng)大的能力仍然知之甚少,這反映了我們知識(shí)體系的局限性。正如普朗克所說(shuō), “科學(xué)是內(nèi)在的整體,被分解為單獨(dú)的部門(mén)不是取決于事物的本質(zhì),而是取決于人類(lèi)認(rèn)識(shí)能力的局限性。實(shí)際上存在著由物理學(xué)到化學(xué)、通過(guò)生物學(xué)和人類(lèi)學(xué)到社會(huì)科學(xué)的鏈條,這是一個(gè)任何一處都不能被打斷的鏈條。”對(duì)大模型涌現(xiàn)能力的不了解,恰恰說(shuō)明了我們對(duì)復(fù)雜科學(xué)所構(gòu)成的科學(xué)宏偉藍(lán)圖的不了解。
目前,我們對(duì)于人工智能的強(qiáng)大能力仍然沒(méi)有完全的認(rèn)識(shí),無(wú)法從科學(xué)研究的模型和方上進(jìn)行充分解釋。雖然我們可以將其視為一個(gè)概率網(wǎng)絡(luò),通過(guò)單詞之間的概率流程實(shí)現(xiàn)連貫性,但我們?nèi)詿o(wú)法解釋為何ChatGPT在參數(shù)規(guī)模達(dá)到千億級(jí)時(shí),它具備涌現(xiàn)能力,而在百億級(jí)時(shí)卻沒(méi)有。類(lèi)似地,人類(lèi)大腦擁有數(shù)百億個(gè)神經(jīng)元,但我們對(duì)于意識(shí)、情感和疼痛等產(chǎn)生的機(jī)理仍然不清楚。
ChatGPT的快速進(jìn)展使得我們難以跟上其變化的步伐。它通過(guò)不斷學(xué)習(xí)大規(guī)模的數(shù)據(jù)實(shí)現(xiàn)了日新月異的發(fā)展速度,與人類(lèi)相比,它不斷進(jìn)化而不受限制。此外,它同步利用用戶(hù)的反饋和日活躍用戶(hù)(約10億人)的互動(dòng)來(lái)改進(jìn)自身算法。
盡管我們尚未能夠?qū)I產(chǎn)生的能力進(jìn)行準(zhǔn)確的數(shù)學(xué)模型解讀,但這并不意味著AI是可怕的惡魔,我們對(duì)于人工智能產(chǎn)生的能力仍需深入研究和理解。
談AI安全和合規(guī):機(jī)器尚未產(chǎn)生意識(shí)與情感
網(wǎng)易科技:AI安全性目前已經(jīng)是最熱門(mén)的話(huà)題之一。馬斯克以及千名科學(xué)家共同簽署了叫停更高級(jí)別AI訓(xùn)練的文件,您認(rèn)為AI的進(jìn)化未來(lái)是否會(huì)超出了人的控制?
吳飛:人們對(duì)GPT的發(fā)展表示擔(dān)憂(yōu),主要是因?yàn)樗邆淞硕嗄B(tài)的能力。包括馬斯克在內(nèi)的一些科學(xué)家,要求對(duì)其進(jìn)行安全限制,甚至?xí)和_M(jìn)一步研發(fā)更高級(jí)別的AI。是因?yàn)樗麄儞?dān)心,隨著GPT-4具備自我意識(shí)和更快速的發(fā)展,它可能會(huì)超出人類(lèi)的控制范圍。
相較于我認(rèn)同AI應(yīng)該作為人類(lèi)的助手并與我們共存共進(jìn)化的觀點(diǎn)?!度祟?lèi)簡(jiǎn)史》作者尤瓦爾·赫拉利等科學(xué)家則認(rèn)為機(jī)器文明會(huì)取代人類(lèi)文明。他們擔(dān)心GPT-4目前輸出的內(nèi)容完全是基于現(xiàn)有信息重新生成的,它可能會(huì)摧毀人類(lèi)長(zhǎng)期積累的文明,使下一代或下下一代接受的文化主要由機(jī)器創(chuàng)作。
馬斯克提出了四個(gè)暫停GPT訓(xùn)練的理由,一是機(jī)器錯(cuò)誤信息的擴(kuò)散:擔(dān)心機(jī)器生成的錯(cuò)誤信息在互聯(lián)網(wǎng)上不斷擴(kuò)散,并且可能偽裝成真實(shí)信息;二是自動(dòng)化取代人類(lèi)工作:擔(dān)心機(jī)器會(huì)完全自動(dòng)化人類(lèi)的所有工作,對(duì)就業(yè)帶來(lái)威脅;三是產(chǎn)生非人類(lèi)思維:擔(dān)心機(jī)器可能產(chǎn)生超越人類(lèi)的思維方式,引發(fā)不可預(yù)測(cè)的結(jié)果;四是威脅人類(lèi)文明存在:擔(dān)心機(jī)器發(fā)展到一定程度會(huì)代替人類(lèi)文明,摧毀人類(lèi)的文化積累。
對(duì)于這四點(diǎn),我認(rèn)為馬斯克的觀點(diǎn)更像是一種長(zhǎng)遠(yuǎn)的預(yù)警和未雨綢繆的思考,而非具體的行動(dòng)建議。其中后三點(diǎn)可能在未來(lái)幾十年內(nèi)并不會(huì)成為現(xiàn)實(shí),因?yàn)闄C(jī)器出現(xiàn)意識(shí)是非常困難的。
因此,對(duì)于AI的發(fā)展存在兩種觀點(diǎn):一種是機(jī)器作為人類(lèi)的助手與我們共生共進(jìn)化,另一種是機(jī)器逐漸取代人類(lèi),使人類(lèi)成為機(jī)器的奴役對(duì)象。這種擔(dān)憂(yōu)在科幻電影中就曾展現(xiàn)過(guò)。總體而言,機(jī)器產(chǎn)生意識(shí)和情感與人類(lèi)的幻想相距甚遠(yuǎn)。
網(wǎng)易科技:您認(rèn)為人工智能是否需要嚴(yán)格的監(jiān)管與控制?具體應(yīng)從哪方面入手?
吳飛:2016年,在制定《新一代人工智能發(fā)展規(guī)劃》時(shí),大家就一致認(rèn)為要解決社會(huì)對(duì)人工智能的關(guān)切和憂(yōu)慮,特別是涉及到數(shù)據(jù)隱私保護(hù)和大數(shù)據(jù)濫用等問(wèn)題。
比如規(guī)劃強(qiáng)調(diào)要解決大數(shù)據(jù)殺熟等問(wèn)題,保護(hù)個(gè)人數(shù)據(jù)隱私,并制定相應(yīng)的政策和措施;要建立高效治理體系,確保人工智能的發(fā)展在法律、倫理和社會(huì)責(zé)任的框架下進(jìn)行;要提供一種有效的方式來(lái)管理人工智能的發(fā)展和應(yīng)用,確保其符合國(guó)家利益、社會(huì)穩(wěn)定和公眾利益。
要提倡制定相關(guān)政策和法規(guī),以規(guī)范人工智能技術(shù)的研發(fā)、應(yīng)用和運(yùn)營(yíng),同時(shí)加強(qiáng)監(jiān)管和監(jiān)督機(jī)制;要鼓勵(lì)國(guó)際合作和跨部門(mén)協(xié)調(diào),共同應(yīng)對(duì)人工智能的挑戰(zhàn)和問(wèn)題,推動(dòng)全球人工智能領(lǐng)域的發(fā)展和合作。
我認(rèn)為這個(gè)思路是正確的,人工智能的監(jiān)管可以從以上幾個(gè)方面入手。
談AI行業(yè)應(yīng)用:傳統(tǒng)應(yīng)試教育受到?jīng)_擊
網(wǎng)易科技:您認(rèn)為AIGC首先會(huì)沖擊哪些行業(yè)?如何看待AIGC對(duì)于教育行業(yè)的賦能?教師與學(xué)生的角色有了哪些轉(zhuǎn)變?
吳飛:不可否認(rèn),人工智能對(duì)教育領(lǐng)域產(chǎn)生了沖擊,例如使用GPT來(lái)完成作業(yè)、論文等任務(wù),這對(duì)傳統(tǒng)的應(yīng)試教育方式構(gòu)成了挑戰(zhàn)。
我認(rèn)為在教育行業(yè),培養(yǎng)創(chuàng)造能力和創(chuàng)新能力比獲取特定知識(shí)更為重要。我很認(rèn)同教育家培根關(guān)于教育的觀點(diǎn):將學(xué)校學(xué)習(xí)和閱讀視為兩種教育手段。教師角色在變化,他們應(yīng)該不僅僅傳授知識(shí),還需教導(dǎo)學(xué)生如何獲取知識(shí)、要結(jié)合理論分析和哲學(xué)思辨的教育方式,讓學(xué)生利用已有的知識(shí)解決問(wèn)題,并對(duì)學(xué)生進(jìn)行批判性思維和分析能力的培養(yǎng)。
此外,學(xué)生同樣應(yīng)該具備提問(wèn)的能力,要能夠進(jìn)行問(wèn)題驅(qū)動(dòng)的學(xué)習(xí)和思考。比如學(xué)生在學(xué)習(xí)中應(yīng)該追溯知識(shí)的原點(diǎn)和歷史發(fā)展,了解知識(shí)體系的形成過(guò)程,同時(shí)在不同知識(shí)領(lǐng)域的邊界交叉處尋找聯(lián)系和啟發(fā)。
近期有大學(xué)生使用ChatGPT生成本科畢業(yè)論文,其語(yǔ)言?xún)?nèi)容雖然表面上滴水不漏,但觀點(diǎn)空洞;有大學(xué)生將搜索引擎搜到的例子發(fā)給GPT,GPT生成的語(yǔ)言將不同地點(diǎn)和概念進(jìn)行了關(guān)聯(lián),但缺乏與實(shí)體世界的具體連接。
由此可見(jiàn),ChatGPT在教育中的應(yīng)用需要考慮到其產(chǎn)生的內(nèi)容是否正確、錯(cuò)誤以及有不完善之處。若想讓人工智能生成更好的內(nèi)容,需要提高問(wèn)問(wèn)題的能力,就像是讓GPT具備更好的知識(shí)圖譜和單詞之間的關(guān)聯(lián),以形成連貫的篇章。
網(wǎng)易科技:您認(rèn)為AIGC將會(huì)先取代哪些職業(yè)?
吳飛:人工智能(如ChatGPT)可以在法律案件中提供相關(guān)的法律法條和案例信息,因?yàn)榉煞l和案例都是公開(kāi)的。這種能力可以幫助律師進(jìn)行案件研究和輔助決策。但是,我一直認(rèn)為這不是取代人類(lèi),而是成為人類(lèi)的幫手,提高工作效率。
在教育領(lǐng)域,教師的作用不僅僅是傳授知識(shí),而是多維度的培養(yǎng)學(xué)生。教育需要互動(dòng)和身體力行,而不僅僅是依賴(lài)人工智能生成的合成內(nèi)容。優(yōu)秀的教師能夠更緊密地連接單詞和知識(shí),培養(yǎng)學(xué)生的綜合能力。
人工智能對(duì)新聞業(yè)的影響是幫助記者節(jié)省精力,AI可以去撰寫(xiě)簡(jiǎn)單的快訊,讓記者有更多的精力去專(zhuān)注于更深度和高質(zhì)量的報(bào)道。AI的發(fā)展使得我們能夠更好地釋放創(chuàng)造力。AI暫時(shí)不會(huì)取代記者,但會(huì)讓他們進(jìn)化,提高深度報(bào)道的能力。
人工智能可以提供大量的數(shù)據(jù)支持,但真正理解和應(yīng)用這些數(shù)據(jù)需要長(zhǎng)期的行業(yè)積累和思考。
談AI大模型與國(guó)外差距:自研AI芯片可彌補(bǔ)算力短板
網(wǎng)易科技:在ChatGPT的技術(shù)路線(xiàn)中,數(shù)據(jù)、算法、算力等方面存在哪些技術(shù)壁壘?中國(guó)科技企業(yè)的AI大模型何時(shí)能達(dá)到GPT 3.5的水平?
吳飛:在AI大模型領(lǐng)域,許多國(guó)內(nèi)公司和創(chuàng)業(yè)者都在努力,希望迎頭趕上GPT 3.5或者GPT4的水平。衡量與這些模型的差距是一個(gè)悖論,因?yàn)槿狈γ鞔_的標(biāo)準(zhǔn)來(lái)評(píng)判。
數(shù)據(jù)、算法和算力是影響差距的因素。同時(shí),用戶(hù)反饋會(huì)對(duì)模型的進(jìn)化起著重要作用。開(kāi)放和積累越早,獲取的用戶(hù)反饋越多,模型的能力就會(huì)隨之增強(qiáng)。畢竟在機(jī)器學(xué)習(xí)中,人類(lèi)的反饋被認(rèn)為是至關(guān)重要的,它可以幫助模型進(jìn)行學(xué)習(xí)和改進(jìn)。
首先,對(duì)于算力方面,美國(guó)的GPU芯片如英偉達(dá)的A100或H100,以及谷歌的TPU(Tensor Processing Unit),具備較高的算力,但目前無(wú)法供應(yīng)給中國(guó)市場(chǎng)。這導(dǎo)致中國(guó)在算力方面存在短板。
其次,大型模型的訓(xùn)練需要大量的數(shù)據(jù)支持,例如像GPT-3和GPT-3.5這樣的模型,英文數(shù)據(jù)通常是全球范圍內(nèi)可獲得的,但中文數(shù)據(jù)可能更多地偏向在中國(guó)市場(chǎng)收集。同時(shí)可以利用互聯(lián)網(wǎng)上的開(kāi)源數(shù)據(jù),如維基百科等,中國(guó)在中文數(shù)據(jù)方面可能具有優(yōu)勢(shì),因?yàn)橹袊?guó)的科學(xué)家和工程師對(duì)中文更了解,并且中文的語(yǔ)義和隱喻更深入。
網(wǎng)易科技:面對(duì)巨大的差距,中國(guó)應(yīng)該如何奮起直追,補(bǔ)足短板?
吳飛:由于大家眾所周知的原因,一些先進(jìn)的GPU芯片如A100和TPU無(wú)法在中國(guó)市場(chǎng)銷(xiāo)售,這進(jìn)一步加劇了中國(guó)的算力短缺。
針對(duì)這個(gè)問(wèn)題,中國(guó)一些互聯(lián)網(wǎng)企業(yè)或?qū)I(yè)芯片公司正在研制GPU芯片。
大模型不僅為類(lèi)ChatGPT產(chǎn)品提供機(jī)會(huì),而且可以為各種應(yīng)用提供增值。例如,大模型的能力可以與應(yīng)用的數(shù)據(jù)和功能結(jié)合,使得每個(gè)應(yīng)用都能受益于人工智能算法和模型的力量。這可能帶來(lái)許多機(jī)會(huì),如GPT時(shí)代的美團(tuán),就可以利用人工智能算法來(lái)優(yōu)化數(shù)據(jù)和服務(wù),讓外賣(mài)送得更快,讓配送時(shí)間更合理。
總結(jié)來(lái)說(shuō),我們?cè)贕PU算力芯片方面存在差距,數(shù)據(jù)的可用性對(duì)算力有重要影響。中國(guó)正努力彌補(bǔ)算力短板,包括自主研發(fā)人工智能芯片,大型模型的發(fā)展同時(shí)為各種應(yīng)用提供了機(jī)會(huì)。
網(wǎng)易科技:目前許多高校開(kāi)設(shè)了人工智能與數(shù)據(jù)分析等AI相關(guān)專(zhuān)業(yè),在AI人才培養(yǎng)方面,浙江大學(xué)有哪些嘗試和實(shí)踐?
吳飛:浙江大學(xué)于2018年開(kāi)始批準(zhǔn)人工智能本科專(zhuān)業(yè),并于2019年自設(shè)人工智能交叉學(xué)科。
浙江大學(xué)擁有三位一體的人才培養(yǎng)思路:采取教材、課程和平臺(tái)相結(jié)合的方式進(jìn)行人才培養(yǎng)。浙江大學(xué)編寫(xiě)了新的人工智能教材,包括《人工智能導(dǎo)論:模型與算法》、《可視化導(dǎo)論》和《智能產(chǎn)品設(shè)計(jì)》等,并且在愛(ài)課程(中國(guó)大學(xué)MOOC)建成慕課。
此外,浙江大學(xué)建立了“智?!比斯ぶ悄芸平唐脚_(tái),與企業(yè)合作,該平臺(tái)會(huì)為新一代人工智能教材提供算法實(shí)訓(xùn),讓學(xué)習(xí)者體會(huì)人工智能具能、使能和賦能,從算法層面對(duì)人工智能技術(shù)“知其意,悟其理,守其則,踐其行”。通過(guò)實(shí)訓(xùn)平臺(tái)搭建,將理論知識(shí)轉(zhuǎn)化成賦能應(yīng)用,促進(jìn)人工智能人才培養(yǎng)與國(guó)家、行業(yè)和企業(yè)需求結(jié)合更加緊密結(jié)合。
浙江大學(xué)同時(shí)與企業(yè)如百度、華為、阿里巴巴和商湯等合作,在平臺(tái)中培養(yǎng)學(xué)生,使用國(guó)產(chǎn)的人工智能編程框架和芯片,鼓勵(lì)學(xué)生掌握國(guó)產(chǎn)技術(shù)。在浙江大學(xué)與阿里的合作中,通過(guò)合作項(xiàng)目將大模型壓縮為輕量級(jí)模型,以適應(yīng)移動(dòng)端應(yīng)用。
我們同樣鼓勵(lì)非人工智能專(zhuān)業(yè)學(xué)生的參與,浙江大學(xué)設(shè)立了針對(duì)非計(jì)算機(jī)專(zhuān)業(yè)學(xué)生的輔修專(zhuān)業(yè),以培養(yǎng)非人工智能專(zhuān)業(yè)學(xué)生對(duì)人工智能的應(yīng)用能力,推動(dòng)人工智能在各行業(yè)的發(fā)展。