日韩免费在线观看成人,骚碰成人免费视频,电影院 摸 湿 嗯…啊h

    1. <span id="um726"><blockquote id="um726"></blockquote></span>

        <span id="um726"><blockquote id="um726"></blockquote></span>
        1. 您的位置:首頁>房產 >內容

          GPT-4時代結束!全球最強大模型一夜易主,體驗完Claude 3我更期待GPT-5了

          2024-03-07 08:02:36來源:
          導讀 原標題:今天開始,GPT-4 不再是全球最強大模型全面超越GPT-4苦等數月,沒有等來 GPT-5 ,卻迎來了 ChatGPT 的孿生兄弟 Claude 3。...

          原標題:今天開始,GPT-4 不再是全球最強大模型

          全面超越

          GPT-4

          苦等數月,沒有等來 GPT-5 ,卻迎來了 ChatGPT 的孿生兄弟 Claude 3。

          昨天晚上,Anthropic 正式推出了 Claude 3 系列模型,包括 Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。

          這三款模型在推理、數學、編碼、多語言理解和視覺處理等方面相當扎眼。??

          中杯 Haiku,輕量級的選擇

          大杯 Sonnet,平衡性能與速度

          超大杯 Opus,AI 模型的巔峰之作

          http://claude.ai體驗網址上,Claude 3 免費版用戶使用 Sonnet 模型。而訂閱用戶將能夠體驗到更高級的 Opus 模型。

          中杯大杯超大杯,杯杯有驚喜

          無論是中杯、大杯還是超大杯,Anthropic 推出的每一款模型都蘊藏著驚喜。

          Anthropic 官方宣稱,作為旗艦級別的超大杯 Opus 模型,其智能程度堪比人類,能夠游刃有余地應對開放式問題,并巧妙解決各種復雜挑戰(zhàn)。

          從官方發(fā)布的成績單來看,在知識測試 MMLU、推理測試 GPQA、基礎數學測試 GSM8K 等一系列基準測試中,超大杯 Claude 3 Opus 模型展現了卓越的性能,其每一項得分都全面超越了 GPT-4 以及 Gemini 1.0 Ultra。

          自動播放

          視頻 @dotey(同下)

          若是和 GPT-4 Turbo 對比,情況有所不同

          中杯 Haiku 模型則主打的是響應速度最快且性價比最高。它能在不到三秒的時間內快速消化 arXiv 上的長達約 10000 個詞匯的高密度研究論文及其圖表。

          自動播放

          基準測試結果顯示,Haiku 模型的性能水平介于 GPT-4 和 GPT-3.5 之間,然而在成本效益上,Haiku 模型的性價比遠超 GPT-4。

          圖表來自 @FinanceYF5

          在大多數工作任務中,Sonnet 的速度比 Claude 2 和 Claude 2.1 快一倍,且在智能處理能力上也實現了質的飛躍。它特別擅長需要迅速響應的任務,例如知識檢索和銷售自動化。

          自動播放

          相較之下,超大杯 Opus 的性能雖然更強,但響應的速度模型卻和舊模型大致相同。

          值得一提的是,和前代模型相比,Claude 3 最突出的新增能力在于其視覺識別能力。這意味著它能處理包括照片、圖表、圖形以及技術圖紙等多種視覺資料,而這種多模態(tài)能力也正是當今頂尖 AI 模型必備的功能。

          眾所周知,大部分頂尖模型往往基于英文語料庫進行訓練,這導致它們在英語答案生成上的表現通常遠超其他語言,而 Claude 3 打破了這一桎梏,在西班牙語、日語和法語等非英語語言的交流中展現出更強大的溝通能力。

          自成立之初,Claude 便以「安全而負責任的 AI」著稱,既是其引以為傲的亮點,亦是其雙刃劍般的存在。比如過往的 Claude 模型經常無端地拒絕回答問題。

          而升級后的 Claude 3 模型已經在理解用戶請求方面邁出了步,能夠敏銳地識別出風險問題,并且精準地區(qū)分無害的請求。

          在提升性能的同時,Claude 3 也兼顧了模型的安全性和可靠性,依然嚴格遵循人工智能安全等級 2(ASL-2)的標準。

          人工智能安全等級2(ASL-2)是一個用于評估和分類人工智能系統潛在風險的等級體系中的一個級別。

          ASL-2通常意味著該級別的AI系統具有中等的潛在風險,需要采取一定的安全措施來確保其安全運行,但這些風險是可控的,并且系統在大多數情況下不會對人類或環(huán)境構成嚴重威脅。

          針對當前大模型普遍存在的幻覺問題,Anthropic 也注意到了這一問題,專門針對現有模型的已知缺陷設計了一系列復雜且基于事實的問題。

          在評估模型的回答時,他們將回答分類為正確、錯誤(或虛構)以及不確定性承認。這種方法允許模型在不確定時明確表示其知識的局限性,而不是提供可能誤導的錯誤信息,從而提高了 AI 系統的透明度和可靠性。

          與 Claude 2.1 相比,超大杯 Opus 在處理這些具有挑戰(zhàn)性的開放式問題時,正確率翻了一番,同時大幅減少了錯誤答案的產生。

          類似于 Perplexity 的思路,除了生成更可信的回答外,Anthropic 即將在 Claude 3 模型中啟用引用功能,使其能夠引用參考材料中的具體句子,以此來驗證其答案的正確性。Perplexity 怕是要瑟瑟發(fā)抖了。

          借鑒了 Perplexity AI 答案引擎的思路,Anthropic 計劃為 Claude 3 模型新增引用功能,使其能夠引用參考材料中的具體句子,以此來驗證其答案的正確性。

          Claude 3 系列模型在剛推出時僅支持最多 20 萬 個 tokens 的上下文窗口,單次可處理大約 15 萬個單詞。

          不過,和 Gemini 1.5 Pro 一樣,Claude 3 全系模型均能處理超過 100 萬個 tokens 的輸入,再次回歸到 AI 模型的第一檔次。而這項功能僅對需要更高處理性能的特定客戶開放。

          衡量上下文窗口能力的試金石,依然是我們熟悉的「大海撈針」測試。

          「大海撈針」(NIAH)評估測試的是模型從大量數據中準確檢索信息的能力。為了增強這一測試的可信度,Anthropic 官方更是隨機在多樣化的眾包文檔集合中進行測試。

          結果顯示,超大杯 Claude 3 Opus 不僅以超過 99% 的準確率實現了信息檢索的近乎完美表現,而且在某些情況下,它能識別出那些作為「針」的句子是由人為刻意的,充分展現了其對信息環(huán)境的深刻理解。

          瞧瞧這滿屏的綠色`

          目前,Opus 和 Sonnet 已經正式開放,集成在 Anthropic 的 API 中,開發(fā)者們現在可以注冊并開始使用這些模型。Haiku 模型也即將在不久后推出。

          模型細節(jié)

          為了介紹這三款模型,Anthropic 也一口氣發(fā)布了一份長達 42 頁的技術報告

          報告地址入口:https://-cdn.anthropic.com/de8ba9b01c9ab7cbabf5c33b80b7bbc618857627/Model\_Card\_Claude\_3.pdf

          Claude 3 實測 :能和 GPT-4 一較高下嗎?

          在 Claude 3 發(fā)布之后,網友 @op7418 第一時間嘗試了 Claude 3 Opus,并做了三個測試。

          網友首先對 Claude 3 Opus 的翻譯能力進行了測試,挑戰(zhàn)了一段復雜的英文文本。結果顯示,Opus 的翻譯不僅條理分明,而且分段和排版得當,使得閱讀體驗大幅提升。但若論翻譯的流暢度與準確性,GPT-4 依舊略占上風。

          此外,網友又用一張風格復雜的設計稿截圖考驗 Opus 的細節(jié)還原能力。在網友明確指出需要還原樣式后,Opus 精準把握設計元素,整體表現要比 GPT-4 要好。

          多模態(tài)能力也是 Opus 值得考察的重點。它不僅能讀懂學術論文的精髓,還能把分析結果呈現得一清二楚。不過,跟 GPT-4 比起來,Opus 在信息的豐富度上似乎還有點「成長空間」。

          網友 @mlpowered 向 API 提供了長達兩小時的視頻講稿以及精選的關鍵畫面截圖,成功制作出了一篇內容豐富、圖文并茂的 HTML 格式博客文章。

          網友 @7oponaut 分別用 Opus 和 GPT-4 分別玩起了井字游戲,遺憾的是 Opus 并不能順利地畫出網格。,而 GPT-4 則宣告成功。

          我們也實測了 Claude 3 一些效果,比如看圖識別菜譜。

          解釋方程式。

          提取 JSON 文件。

          留給 OpenAI 的時間不多了?

          有趣的是,在 Claude 3 發(fā)布后,討論最多的卻是老對手 ChatGPT。

          英偉達高級科學家 Jim Fan 已經在期待 GPT-5 的亮相了。

          網友體驗后的真性情。

          留給 Sam Altman 的時間不多了。

          只有 Q* 的出現才能徹底搶走 Claude 3 的風頭。

          前 Open AI 開發(fā)者關系主管 Logan Kilpatrick 送上祝賀。

          對 Claude 3 史無前例的夸贊。

          網友做的梗圖

          網友在 Altman 評論區(qū)催更。

          而該評論的推文上,Sam Altman 正在轉發(fā) Ron Conway 的一封署名信。

          為了構筑一個更加美好的未來,我們呼吁全人類共同努力,廣泛開發(fā)和應用人工智能(AI),以此來提升人們的生活質量,開啟美好未來的大門。

          人工智能的終極目標,在于讓人類生活得更加美好,超越以往任何時代的可能。

          盡管人工智能技術仍處于發(fā)展初期,但它正逐步滲透到我們日常生活的各個方面:從提供學習幫助的 AI 導師,到連接世界的 AI 翻譯工具;從促進醫(yī)療保健的 AI 輔助診斷,到加速科學發(fā)現的 AI 研究工具;再到能夠協助我們處理日常事務的 AI 對話助手。

          人工智能在直接增強人類思維能力方面具有獨特優(yōu)勢。我們預計,它對人類社會的影響將與印刷術、內燃機、電力及互聯網相似。人工智能對人類正面與負面影響的平衡,將取決于我們每個人的行動和深思熟慮。我們肩負著共同的責任,要做出明智的選擇,以最大限度地發(fā)揮人工智能的積極作用,并減少其潛在風險,不僅為了今天,也為了未來世代。

          每個人都可以為塑造人工智能的未來做出貢獻,無論是使用它來創(chuàng)造和學習的人們,還是在這項技術基礎上開發(fā)新產品和服務的創(chuàng)新者,亦或是利用人工智能探索人類面臨的重大挑戰(zhàn)的解決方案的先行者,以及那些分享對人工智能影響生活的希望和憂慮的人們。人工智能屬于我們所有人,每個人都在構建能夠改善人類生活的人工智能過程中扮演著重要的角色。

          免責聲明:本文由用戶上傳,如有侵權請聯系刪除!

          猜你喜歡

          最新文章