谷歌于今年 3 月底發(fā)布了 Gemini 2.5 Pro 模型,緊接著又在 4 月推出了面向更廣泛用戶的輕量級版本 Gemini 2.5 Flash。兩者目前仍處于預(yù)覽階段,但 Flash 版本已可通過 Gemini App 向全球用戶開放體驗(yàn)。
目前,谷歌再度更新 Google AI Studio 中的 Gemin 2.5 Pro 預(yù)覽版模型(IT之家注:更新至 06-05 版本),并聲稱該模型刷新了多項(xiàng) AI 性能基準(zhǔn)“跑分”:
LMArena Elo 評分上升 24 分
WebDevArena Elo 評分上升 35 分至 1443 分,取得業(yè)界領(lǐng)先地位
在 GPQA 和 Humanity's Last Exam 等高難度測試中“表現(xiàn)出色”
谷歌還回應(yīng)了上一個 Gemini 2.5 Pro 預(yù)覽版(05-06 版本)用戶們對于“模型性能短暫下滑”的抱怨,聲稱模型“已在風(fēng)格與結(jié)構(gòu)方面進(jìn)行了優(yōu)化”,使模型“更具創(chuàng)意、回答格式更清晰”,提升了交互體驗(yàn)。
值得注意的是,谷歌近期還放寬了 Pro 版用戶的請求限制(query limits),這也許預(yù)示著該版本在本月正式上線后會有更具吸引力的價格策略。