Cloud&AI
`
2025/6/23 08:55
性能超OpenAI、Gemini!月之暗面發(fā)布首個自主強(qiáng)化學(xué)習(xí)Agent
0
0

據(jù)媒體報(bào)道,月之暗面(Moonshot AI)正式推出其首款A(yù)gent產(chǎn)品——Kimi-Researcher(深度研究),并已啟動小范圍灰度測試。

該產(chǎn)品基于端到端自主強(qiáng)化學(xué)習(xí)(end-to-end agentic RL)技術(shù)打造,在HLE測試中表現(xiàn)優(yōu)異,性能超越Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research,并與Gemini-Pro的Deep Research Agent持平。

Kimi-Researcher 是一款高度自主的智能研究助手,能夠獨(dú)立規(guī)劃任務(wù)流程并交付完整結(jié)果。與其他Agent不同,它采用零結(jié)構(gòu)設(shè)計(jì),無需復(fù)雜提示詞或預(yù)設(shè)流程,完全依靠自主決策能力在動態(tài)環(huán)境中運(yùn)行。

例如,它能自行判斷信息沖突時的權(quán)衡策略、任務(wù)節(jié)點(diǎn)的切換時機(jī),以及中間信息的取舍標(biāo)準(zhǔn),其核心驅(qū)動力始終是任務(wù)的實(shí)際解決效果。

作為一款深度研究模型,Kimi-Researcher 整合了多源數(shù)據(jù),并支持每條引用的直接追溯,確保研究嚴(yán)謹(jǐn)性,有效減少幻覺問題。月之暗面表示,未來將逐步開源Kimi-Researcher 的基礎(chǔ)預(yù)訓(xùn)練模型及強(qiáng)化學(xué)習(xí)優(yōu)化版本,以推動Agent強(qiáng)化學(xué)習(xí)領(lǐng)域的探索與發(fā)展。

性能超OpenAI、Gemini!月之暗面發(fā)布首個自主強(qiáng)化學(xué)習(xí)Agent

免責(zé)聲明:本文僅代表作者個人觀點(diǎn),與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。

給作者點(diǎn)贊
0 VS 0
寫得不太好

C114簡介     聯(lián)系我們     網(wǎng)站地圖

Copyright©1999-2025 c114 All Rights Reserved 滬ICP備12002291號-4

C114通信網(wǎng)版權(quán)所有 舉報(bào)電話:021-54451141 用戶注銷