文章開始之前先說個冷知識:今年是 Google 舉辦 I/O 開發(fā)者大會的第 15 個年頭。
縱觀近七年來的 I/O 大會,AI 內(nèi)容一直是 Google 的重中之重。例如在 ChatGPT 爆火之前,Google 就已經(jīng)在 I/O 大會上展示過 LaMDA 系列語言生成模型,只是一直沒等到大火的機會。
如今,ChatGPT 的爆發(fā)讓 AI 來到了最好的時刻,但也讓 Google 感到無比焦慮。
看完整場大會,Google 共提及「AI」一詞近 200 次,幾乎把 AI 寫進了包括 Gmail、搜索、Pixel 等所有產(chǎn)品里面,迫切地想向所有人證明自己仍在 AI 最前沿。
如果把這場大會開在半年以前,那么它將無比精彩:AI 協(xié)助辦公、AI 搜索、AI 編程,每一項都是重要的技術(shù)應(yīng)用。只可惜在此之前,微軟已經(jīng)把所有的路都走了一遍。
現(xiàn)場觀眾的反應(yīng)甚至可以說有點冷淡。事實上,現(xiàn)場只出現(xiàn)了兩次熱烈的歡呼:Bard 的暗黑模式,和 Pixel 平板免費贈送底座。
在今天的 I/O 大會 上,Google 發(fā)布的新產(chǎn)品、技術(shù)都像是對微軟和 OpenAI 的一次追趕——追趕那個被搶先實現(xiàn)的 AI 未來。
PaLM2,Google 反擊 GPT-4 的秘密武器
大語言模型目前儼然成為了科技圈最頂尖的產(chǎn)品,各家公司都希望能夠拿出能夠叫板 GPT 的自研模型,以證明自己的科研實力,Google 也不例外。
Google 發(fā)布了全新一代的大語言模型 PaLM2,與 GPT-4 對抗。
根據(jù) Google 介紹,他們用了大量數(shù)學(xué)和科學(xué)數(shù)據(jù)集對 PaLM 2 進行訓(xùn)練,相比去年的 PaLM 模型,PaLM 2 在多語言處理、推理和編碼能力上有了很大的提升 。
原文地址在下方 ??: https://ai.google/static/documents/palm2techreport.pdf
根據(jù) Google 的官方測試,PaLM2 的部分結(jié)果(例如數(shù)學(xué))比 GPT-4 還要好。
Google 并沒有透露 PaLM 2 具體的參數(shù)規(guī)模,只提到 PaLM 2 是基于最新的 JAX 和 TPU v4 計算設(shè)施構(gòu)建的。Google 對 PaLM 2 做了算法優(yōu)化,使得它在體積上比 PaLM 要小,但整體性能更好,計算效率更高。
PaLM 2 支持 100 多種不同的語言和 20 多種編程語言,包括 JavaScript、Python、Prolog、 Verilog、Fortran 等,可以說是個語言通。
僅能做常規(guī)的文字理解和生成還不夠,支持多模態(tài)的 PaLM 2 還能看懂和生成音視頻內(nèi)容,Google 展示了一個名為 Med-PaLM 的專為醫(yī)療領(lǐng)域微調(diào)的模型,可以根據(jù) X 光片分析病人傷勢,Google 其在這方面已經(jīng)達到人類醫(yī)生的水平。
PaLM 2 模型還可以「拆分」成不同大小的 4 種版本,在各種設(shè)備上部署。例如在智能手機上就可以運行規(guī)模比較小的 Gecko 模型,讓移動端也能擁有大語言模型。
值得一提的是,PaLM 2 目前已經(jīng)開放預(yù)覽,Google 自家的聊天機器人 Bard 已經(jīng)用上了 PaLM 2 模型,增強自己的作答能力。Google 內(nèi)容已經(jīng)有超過 70 個產(chǎn)品團隊在使用 PaLM 2 構(gòu)建產(chǎn)品,本場大會上絕大部分更新都是基于 PaLM 2 模型設(shè)計而來,可以說 PaLM 2 就是 Google 全面 AI 化的核心引擎。
除了 PaLM 2,Google CEO 桑德爾·皮查伊還稍微了劇透了一點下一代大模型 Gemini(雙子座)的消息,他稱 Gemini 旨在實現(xiàn)多模態(tài)、高效和為未來創(chuàng)新而構(gòu)建。。
Gemini 是 Google Brain 和 DeepMind 兩個頂尖 AI 團隊合并后共同開發(fā)的全新模型,從命名上可以看出,Gemini 將會集二者之所長,有望擠入最強大的大語言模型之列。
Bard:升級多模態(tài),能畫圖也能讀圖
更好看,更綜合,更多人可以用到。
在不到 2 個月的更新后,Google 將 Bard 遷移到功能更強大的大語言模型 PalM2,這個 ChatGPT 和 BingChat 的競爭對手得到了大幅更新,能力更強大:
英美限定、只會英文、等候名單,想用到限制頗多的 Bard 并不是件容易事。即日起,Bard 正式宣布取消等候名單,并向 180 多個國家和地區(qū)開放體驗。
Bard 現(xiàn)在還支持了日語和韓語,很快就會將支持語言擴大到 40 種,包括中文。
功能方面 Bard 也有不小的升級,用四個字總結(jié)就是「圖文并茂」。詢問 Bard 問題時,它不再是一個只會干巴巴回復(fù)文字的機器人,還能用圖片的形式為我們展示更豐富直觀的答案。
同時,Google 還將 Google Lens 的能力帶入了 Bard,讓后者不僅可以回復(fù)圖片,還能看懂圖片,根據(jù)圖片信息起草內(nèi)容。比如,你可以把一只狗的照片發(fā)給他,讓它根據(jù)狗的品種來寫一些標(biāo)題。
或許是隔壁文生圖的功能好評聲音太大,Google 也為 Bard 新增了這一功能,不過它是與 Adobe Firefly 合作的,整合了 Firefly 的 Bard,就可以用自然語言生成高質(zhì)量圖像了。而且有了 Adobe 的背書,圖片的版權(quán)、質(zhì)量都不需要擔(dān)心。
Adobe 只是開始,Google 還將與 Kayak、OpenTable、zip 招聘公司、可汗學(xué)院等多個合作伙伴與同努力,為 Bard 增加更多功能。
相比 ChatGPT,Bard 的定位更偏向 BingChat,兼顧搜索引擎與生產(chǎn)力工具的它,會在下周加入引用功能,并為生成的代碼展示來源以確保準(zhǔn)確性。并新增了導(dǎo)出、運行代碼的能力,方便開發(fā)人員高效工作。順便還新增了深色模式,引起了現(xiàn)場歡呼。
雖然初登場時鬧過一些烏龍,但 Google 還是讓我們看到了一個不斷進步的 Bard。只可惜在介紹中我們聽到最多的詞還是「we’ll」,等今日發(fā)布的功能全部實裝上線后,Bard 就是一款足夠全面且成熟的工具了。
Duet AI:辦公的事交給 AI 做
Copilot 的競爭者來了。
Google 為自己的 Workspace 引入了一個全新的工具 Duet AI,讓我們看到了 AI 在基于云計算的 Google 辦公套件中扮演的角色:
在 Google 文檔中,你可以告訴 Duet AI 想要創(chuàng)作的內(nèi)容,讓它自動生成文章。你也可以讓它根據(jù)需求生成不同文風(fēng)。
「閱讀」文章、重點提問的類「ChatPDF」功能也沒落下。
這些文字生成、擴寫、調(diào)整的能力,同樣也應(yīng)用在 Google Mail 里。
幻燈片方面,Duet AI 扮演著一個圖片生成器的角色,可以幫你節(jié)省在互聯(lián)網(wǎng)上找圖的時間,并用原創(chuàng)內(nèi)容來豐富幻燈片。
在表格里,Duet AI 可以根據(jù)你的提問自動整理數(shù)據(jù),讓數(shù)據(jù)更加規(guī)范。
這些能力也可以與其他 Google 服務(wù)進行聯(lián)動,比如當(dāng)你在 Bard 中創(chuàng)建好一個表格后,可以一鍵生成表格文檔,方便后續(xù)使用。
Duet AI 還增加了一套機器學(xué)習(xí)驅(qū)動的 Google 云開發(fā)工具,可以提供實時代碼糾錯、生成等,支持 Go、Java、Javascript、Python 和 SQL 等多種開發(fā)語言。
不用等 Bard 通過的我們,現(xiàn)在又可以等 Duet AI 了,如果你想體驗這些功能,還是需要加入等待名單,等待 Google 在對應(yīng)地區(qū)開啟測試。
總體來說,Duet AI 少了些初見 Copilot 的驚艷,功能演示上似乎也弱了一些。但 Bard 用不到兩個月的時間便迎頭趕上,期待 Duet AI 能帶來更多可能性吧。
Google 搜索:重新定義,全面全能
未來的搜索,或許應(yīng)該長這樣:
在 PaLM 2 的驅(qū)動下,Google 搜索也迎來了革新,推出了全新的搜索引擎 SGE(Search Generative Experience),你不需要再把一個大問題分割成多個小問題,搜索后再把答案湊起來,有了生成式 AI 的加持,你可以讓搜索干一些重活了。
大會中,Google 重點展示了生成式 AI 在購物方面的提升,當(dāng)你使用 Google 搜索一款產(chǎn)品時,你會看到它的產(chǎn)品描述、評論、價格和展示圖。
擁有超過 350 億產(chǎn)品列表的 Google,還在以每小時 18 億的速度不斷更新著,通過 Google 搜索購物,你可以獲得更新鮮、可靠的結(jié)果。
Google 認為,廣告是互聯(lián)網(wǎng)的重要組成部分,他們將繼續(xù)堅持對廣告透明度的承諾,并保證廣告和搜索結(jié)果的區(qū)分。
今天 Google 將開放搜索實驗室的注冊,并在未來幾周內(nèi)開啟訪問,支持 Google app 和 Chrome 瀏覽器。申請鏈接如下:labs.google.com/search
Google 的 AI 焦慮,只能用 AI 來解
有人戲稱本屆 Google I/O 應(yīng)該叫做 Google AI/O ,微軟和 OpenAI 的珠玉在前,Google 少了一點令人高呼 Amazing 的時刻,但這無疑也是 Google 近年來最為堅決的一次自我革命。
自稱 AI-first 的 Google,卻一直因為過于謹慎保守的策略多次錯失先機。如今 Google 也終于意識到自己必須快速行動,就像 Google 多位高管所說的那樣要「大膽而負責(zé)任」,不能再因為害怕犯錯而躊躇不前了。
當(dāng)然 AI 也并非萬能藥,大升級后的 Bard 也未必能改變 Google 搜索被顛覆的趨勢。但毫無疑問,AI 會重塑搜索,徹底改變這種交互方式。
份額遠不如 Google 的 Bing 已經(jīng)通過聊天機器人,在短短幾個月達到超過 1 億的日活躍用戶,進行了超過 5 億次聊天,其中 70% 嘗試新 Bing 聊天功能的用戶, 都會用來進行搜索相關(guān)的任務(wù)。
當(dāng)全球最大的搜索引擎決定拋下過往包袱,完全擁抱這個趨勢,被改變的或許就不僅僅是 Google 的未來,更可能顛覆互聯(lián)網(wǎng)的運行機制,改變數(shù)十億的用戶的交互。
一個全新、更簡潔的世界將會來臨。