編譯 | Glu
編輯 | 李水青
智東西6月18日消息,據(jù)外媒The Information報(bào)道,各國之間對待AI抓取數(shù)據(jù)的不同做法有沖突,或許還會導(dǎo)致、經(jīng)濟(jì)的緊張局勢。
本周三,歐盟主要的立法機(jī)構(gòu)歐洲議會已通過了一項(xiàng)名為《人工智能法案》(AI Act)的法律草案,這是世界上第一步監(jiān)管AI的法案。今年3月底,意大利數(shù)據(jù)保護(hù)機(jī)構(gòu)以不符合歐洲數(shù)據(jù)保護(hù)各項(xiàng)規(guī)定為由,禁用了ChatGPT。盡管意大利后來撤銷了這個禁令,但不難看出AIGC(生成式AI)的立法問題受到了各界關(guān)注。
▲歐洲議會討論《人工智能法案》
一、OpenAI或以非盈利為由,避開數(shù)據(jù)侵權(quán)爭議
The Information記者認(rèn)為,AIGC引發(fā)的爭議主要還是在于數(shù)據(jù)。數(shù)據(jù)可以幫助訓(xùn)練大語言模型,大語言模型又能為ChatGPT、谷歌Bard等聊天機(jī)器人提供動力,所以數(shù)據(jù)很重要,這些數(shù)據(jù)則通常是通過挖掘公開內(nèi)容、訪問數(shù)據(jù)存儲庫和掃描大型開放數(shù)據(jù)集獲得的。
但在挖掘數(shù)據(jù)的過程中,難免會抓取到受版權(quán)保護(hù)的內(nèi)容,這引發(fā)了各界人士的擔(dān)憂。一些歐洲數(shù)據(jù)保護(hù)監(jiān)管機(jī)構(gòu)擔(dān)憂AIGC在處理個人數(shù)據(jù)時“亂來”,畢竟它們沒有法律依據(jù),也不需要遵守GDPR(《一般數(shù)據(jù)保護(hù)條例》)原則;美國聯(lián)邦貿(mào)易委員會也對OpenAI和其他大型語言模型缺乏問責(zé)制、治理提出了質(zhì)疑。
管理數(shù)字技術(shù)的法律還處于相對初級階段,但歷史上的例子或許可以給立法部門一些提示,如曾經(jīng)深陷版權(quán)爭議的谷歌圖書,它曾被作家協(xié)會,但谷歌最終勝訴了,因?yàn)樵谝驗(yàn)闄?quán)衡版權(quán)侵權(quán)問題時,考慮了“實(shí)用性”以及“充分改造性”等問題。
與谷歌圖書一樣,AIGC的立法最終其實(shí)就是要回答一個問題,即大模型的數(shù)據(jù)使用是否侵犯版權(quán)。OpenAI可能會爭辯說,大模型只是從他人的工作中學(xué)習(xí),并產(chǎn)生的一種類似于獨(dú)立思考的模式,因此,版權(quán)保護(hù)并不適用。
此外,OpenAI的非營利性公司結(jié)構(gòu)可能為它的數(shù)據(jù)獲取提供保護(hù)。2019年,OpenAI的架構(gòu)進(jìn)行了調(diào)整,調(diào)整后變身為兩家機(jī)構(gòu)——營利性機(jī)構(gòu)OpenAI LP和最初的非營利機(jī)構(gòu)OpenAI。雖然盈利性公司OpenAI LP正在從版權(quán)保護(hù)材料中獲益,但最初收集版權(quán)的是非盈利組織OpenAI。而許多國家在侵權(quán)保護(hù)方面,不涉及非營利組織、科學(xué)研究人員、記者和其他為公共利益工作的人。
二、歐盟稱將出臺幾十項(xiàng)法律,包括禁止企業(yè)利用活人數(shù)據(jù)
The Information記者認(rèn)為,如果非要說的話,那就是OpenAI的崛起時機(jī)、地點(diǎn)都不那么正確。
此刻,歐洲正準(zhǔn)備結(jié)束過往20年所采取的不干涉、放任市場戰(zhàn)略,并開始在大型科技平臺上展示其監(jiān)管力量。歐盟稱其將出臺幾十項(xiàng)新的法律,它希望建立一個完全規(guī)范的技術(shù)生態(tài)系統(tǒng),尊重其公民的權(quán)利和自由。
從這個意義上說,數(shù)據(jù)保護(hù)監(jiān)管機(jī)構(gòu)對OpenAI的打擊與內(nèi)容創(chuàng)作者對谷歌圖書的訴訟威脅明顯不同。一方面,歐洲的GDPR將數(shù)據(jù)保護(hù)確立為一項(xiàng)基本權(quán)利,OpenAI正好給歐洲一個絕妙機(jī)會來“殺雞儆猴”,因?yàn)閷penAI的監(jiān)管可能也會震懾到其他數(shù)據(jù)驅(qū)動的公司,迫使他們遵守這些規(guī)則;另一方面,除非在某些特定條件下,企業(yè)禁止利用可識別活人的有關(guān)信息。
即使OpenAI能把處理個人數(shù)據(jù)的行為合理化,該公司仍必須遵守公平、準(zhǔn)確和合法目的等數(shù)據(jù)保護(hù)原則。此外,GPT的訓(xùn)練數(shù)據(jù)集自2021年9月以來一直保持固定,這讓人對其提供相關(guān)信息的能力產(chǎn)生懷疑。
但到目前為止,ChatGPT最大的問題是數(shù)據(jù)處理的不透明,即使是其開發(fā)人員也無法完全解釋該模型是如何得出結(jié)論的。迄今為止,機(jī)器學(xué)習(xí)研究很少能夠使這些過程清晰可見。OpenAI可以考慮動態(tài)更新ChatGPT,以確保模型是根據(jù)當(dāng)前數(shù)據(jù)進(jìn)行訓(xùn)練的;還可以在用戶設(shè)計(jì)功能投資,以確保用戶不會在不知不覺中交出他們的數(shù)據(jù)。
三、美歐數(shù)據(jù)制度差異大,美國或成AI創(chuàng)企避風(fēng)港
目前,各國在數(shù)據(jù)保護(hù)制度存在許多差距,最終可能導(dǎo)致兩種結(jié)果:要么AI公司在全球范圍遵守更嚴(yán)格的歐盟法律;要么我們可能會目睹全球分裂,美國采取更加自由放任的做法,可能會成為那些希望繼續(xù)在更少限制下運(yùn)營的公司的避風(fēng)港。但最終的方向還是取決于主要利益相關(guān)者,即政府、公司和公眾是否愿意參與有意義的對話并找到共同點(diǎn)。
隨著ChatGPT等AIGC技術(shù)與法律的斗爭不斷展開,我們需要記住歷史的教訓(xùn),并努力在這個快速發(fā)展的環(huán)境中,找到保護(hù)個人權(quán)利與促進(jìn)創(chuàng)新之間的平衡點(diǎn)。
結(jié)語:AIGC立法仍需各國共同協(xié)商
面對長期以來的AIGC數(shù)據(jù)侵權(quán)、缺乏問責(zé)、監(jiān)管混亂等爭議,歐盟于本周三在法律監(jiān)管上邁出了重要的一步,出臺了較為嚴(yán)格的《人工智能法》以保障公眾數(shù)據(jù)安全。
但面對大模型的數(shù)據(jù)爬取,各國采取了不同的措施,如美國的自由方式則較為自由、溫和。最終,對AIGC的監(jiān)管很有可能變成國家與企業(yè)的結(jié)盟問題,導(dǎo)致全球分裂。為了避免這種分裂局面,AIGC的立方還需要各國共同討論與協(xié)商AIGC的未來走向。
來源:The Information