今日,谷歌將 Gemini 2.5 Pro 和 Flash 推出穩(wěn)定版,面向所有用戶全面開(kāi)放,并推出了一款更便宜、速度更快的 Gemini 2.5 Flash-Lite 模型,該模型目前處于預(yù)覽階段,主要用于“大規(guī)模的分類或總結(jié)等高吞吐量任務(wù)”。與此同時(shí),谷歌還為 Gemini 帶來(lái)了一項(xiàng)關(guān)鍵改進(jìn) —— 支持視頻上傳與分析功能。
據(jù) 9to5Google 報(bào)道,用戶現(xiàn)在可以直接在安卓版 Gemini 中上傳視頻進(jìn)行分析。操作過(guò)程與添加圖片類似:點(diǎn)擊:“+”按鈕,從圖庫(kù)中選擇視頻片段即可。用戶可以要求 Gemini 對(duì)上傳的視頻片段進(jìn)行概述,查找特定部分或物品等。除了文字回復(fù)外,Gemini 還會(huì)在回復(fù)上方顯示視頻的相關(guān)部分。根據(jù)視頻長(zhǎng)度的不同,Gemini 的分析可能需要一些時(shí)間才能完成。
據(jù)了解,Gemini 的視頻分析功能是在其現(xiàn)有能夠總結(jié) YouTube 視頻的能力基礎(chǔ)上的進(jìn)一步拓展。不過(guò),目前用戶還無(wú)法直接通過(guò) Gemini 應(yīng)用錄制視頻,攝像頭界面仍然僅支持拍攝并附加照片到提示詞中。
Gemini 的視頻分析功能使其在與 ChatGPT 的競(jìng)爭(zhēng)中脫穎而出。ChatGPT 目前僅支持分析實(shí)時(shí)攝像頭畫面,類似于 Gemini Live,雖然其可以處理圖片、文檔和 PDF 文件,但尚不支持視頻上傳的分析功能。