免费国产成人高清在线网站,亚洲狠狠色丁香婷婷综合,国产精品400部自产在线观看,国产一区二区三区视频,国产男女爽爽爽爽爽视频

Internet Develppment
互聯(lián)網(wǎng)開(kāi)發(fā)& 推廣服務(wù)提供商

我們擅長(cháng)商業(yè)策略與用戶(hù)體驗的完美結合。

歡迎瀏覽我們的案例。

首頁(yè) > 新聞中心 > 新聞動(dòng)態(tài) > 正文

Kimi首個(gè)萬(wàn)億參數模型開(kāi)源!免費可用,超強Agent推理,附實(shí)測體驗

發(fā)布時(shí)間:2025-07-12 09:30:09來(lái)源:智東西

  智東西7月12日報道,昨夜,國內大模型獨角獸月之暗面發(fā)布并開(kāi)源了其最新一代MoE架構基礎模型Kimi K2,總參數量達到1萬(wàn)億(1T),激活參數為32B。Kimi K2已在Kimi Web端和App端中可用。

  Kimi K2是月之暗面首款開(kāi)源發(fā)布的旗艦模型,在SWE Bench Verified(編程)、Tau2(智能體)、AceBench(工具調用)這三項基準測試中,這一模型取得開(kāi)源模型中的SOTA成績(jì)。

  在自主編程(Agentic Coding)、工具調用(Tool Use)和數學(xué)推理(Math & Reasoning)這三個(gè)能力維度上,Kimi K2的表現超過(guò)了DeepSeek-V3-0324、Qwen-235B-A22B等模型,但在部分基準測試中略遜于Claude 4 Opus、OpenAI GPT-4.1等模型。

  

 

  Kimi K2在預訓練階段使用了“MuonClip”優(yōu)化器實(shí)現萬(wàn)億參數模型的訓練。這一優(yōu)化器能提高Token利用效率,緩解高質(zhì)量人類(lèi)數據的短缺問(wèn)題。月之暗面還應用了大規模Agentic Tool Use數據合成和引入自我評價(jià)機制的通用強化學(xué)習等技術(shù)。

  Kimi K2 API服務(wù)也同步上線(xiàn)。Kimi K2 API支持最長(cháng)128K上下文,計費方案為每百萬(wàn)輸入tokens/4元,每百萬(wàn)輸出tokens/16元,輸入輸出價(jià)格均為DeepSeek V3的2倍。

  Kimi K2系列中的兩個(gè)模型版本現已開(kāi)源,包括未經(jīng)過(guò)指令微調的基礎預訓練模型Kimi-K2-Base和通用指令微調版本Kimi-K2-Instruct(非思考模型)。前者適合科研與自定義場(chǎng)景,后者則可用于大多數問(wèn)答與Agent任務(wù)。

  Kimi K2現已上線(xiàn)無(wú)問(wèn)芯穹Infini-AI異構云平臺(cloud.infini-ai.com/genstudio/),用戶(hù)能以與官方API同樣的價(jià)格調用Kimi K2。

  開(kāi)源鏈接:

  https://huggingface.co/moonshotai/Kimi-K2-Instruct

  體驗鏈接:

  https://www.kimi.com/

  一、編程能力迎提升,實(shí)測效果差強人意

  根據月之暗面博客文章,在前端開(kāi)發(fā)任務(wù)中,Kimi K2能生成有設計感與視覺(jué)表現力的代碼,支持粒子系統、可視化和3D場(chǎng)景等表現形式。官方Demo中,Kimi K2開(kāi)發(fā)了一個(gè)支持晝夜循環(huán)的山川峽谷3D景觀(guān):

  

 

  還生成了粒子特效銀河:

  

 

  為驗證上述能力,智東西向Kimi K2發(fā)送了如下提示詞:

  

 

  最終,Kimi K2交付的網(wǎng)頁(yè)渲染效果并未如官方Demo中那般逼真,交互性和功能豐富度也略遜一籌。

  

 

  在難度較低的個(gè)人網(wǎng)站開(kāi)發(fā)任務(wù)上,Kimi K2展現出一定規劃能力。在未收到明確指示的情況下,Kimi K2主動(dòng)梳理了網(wǎng)站的目錄結構,打造出的網(wǎng)站可擴展性更好。

  

 

  就智東西進(jìn)行的個(gè)人網(wǎng)站開(kāi)發(fā)測試而言,Kimi K2相較Kimi K1.5的UI審美水平進(jìn)步有限。

  

 

  ▲上方為Kimi K2生成結果,下方為Kimi K1.5生成結果

  同樣的任務(wù)交由DeepSeek-V3-0324進(jìn)行處理,最終生成的結果如下:

  

 

  二、Agent工具調用能力增強,擴展風(fēng)格化寫(xiě)作能力

  月之暗面稱(chēng),Kimi K2現具備復雜指令解析能力,可將需求自動(dòng)拆解為一系列格式規范、可直接執行的ToolCall結構。

  開(kāi)發(fā)者可將Kimi K2接入owl、Cline、RooCode等Agent/Coding框架,完成復雜任務(wù)或自動(dòng)化編碼。

  Agent能力已可通過(guò)API使用,更多工具能力即將在Kimi上線(xiàn)。在月之暗面內部測試環(huán)境中的實(shí)際演示里,Kimi K2展現出一定體驗Agentic能力。

  比如,將13萬(wàn)行的原始數據丟給Kimi K2,它可以幫用戶(hù)分析遠程辦公比例對薪資的影響,分析顯著(zhù)差異,自動(dòng)生成統計圖表與回歸模型解讀,并用統一色調做出小提琴圖(violin plot) 、箱線(xiàn)圖(box plot)、散點(diǎn)圖(scatter plot)等專(zhuān)業(yè)圖表,整理成報告。

  

 

  再比如,如果用戶(hù)是Coldplay粉絲,Kimi K2可以幫忙制定今年的追星計劃,完成演唱會(huì )所在城市的機酒與旅游規劃,并且生成日歷,再用html概括完整行程規劃并發(fā)送郵件。

  

 

  Kimi K2還擁有了更強的風(fēng)格化寫(xiě)作能力。官方提供的Demo中,Kimi K2模仿了蘋(píng)果廣告文案風(fēng)格:

  

 

  此外,Kimi K2在通用知識推理、數學(xué)、規劃等任務(wù)中的表現亦有提升,比數字大小的題目已經(jīng)難不住Kimi K2了。

  

 

  結語(yǔ):探索新型優(yōu)化器,未來(lái)將新增思考與視覺(jué)理解

  根據月之暗面博客文章,Kimi K2用MuonClip優(yōu)化器支撐萬(wàn)億參數模型訓練,提升token利用效率。結合大規模Agentic數據合成與通用強化學(xué)習,這一模型的通用智能能力獲得提升。

  為了緩解大規模訓練中的attention logits偏大問(wèn)題,月之暗面拋棄了傳統的Adam優(yōu)化器,提出MuonClip優(yōu)化器,并將其擴展到萬(wàn)億參數規模,提升了訓練穩定性和token使用效率。Kimi K2完成了15.5T token的訓練,全程無(wú)loss spike。

  月之暗面還構建了可大規模生成多輪工具使用場(chǎng)景的合成pipeline,其大規模Agentic Tool Use數據合成可覆蓋數百領(lǐng)域、數千工具,樣本由LLM評估篩選后用于訓練。

  Kimi K2在可驗證任務(wù)上(代碼、數學(xué))使用了強化學(xué)習,還通過(guò)引入自我評價(jià)機制(self-judging),解決了不可驗證任務(wù)的獎勵稀缺問(wèn)題,實(shí)現通用強化學(xué)習,提升泛化任務(wù)表現。

  目前,Kimi K2尚不支持視覺(jué)理解和思考能力,月之暗面稱(chēng)這些能力將在未來(lái)陸續加入。

最新資訊
? 2018 河北碼上網(wǎng)絡(luò )科技有限公司 版權所有 冀ICP備18021892號-1   
? 2018 河北碼上科技有限公司 版權所有.
免费国产成人高清在线网站,亚洲狠狠色丁香婷婷综合,国产精品400部自产在线观看,国产一区二区三区视频,国产男女爽爽爽爽爽视频