智東西作者 陳駿達(dá)編輯 云鵬
(資料圖)
智東西9月27日?qǐng)?bào)道,近日,月之暗面正在小規(guī)模灰度測(cè)試Kimi的Agent模式“OK Computer”。OK Computer的目標(biāo)是通過(guò)更多輪次推理、更多工具調(diào)用、更多token消耗,帶來(lái)更多智能,月之暗面將其定義為一款“全棧助理”。
在OK Computer模式下,Kimi將擁有自己的虛擬電腦,可以連續(xù)工作幾十分鐘,一步一步自主完成需求調(diào)研、規(guī)劃、分析、設(shè)計(jì)、開(kāi)發(fā)等環(huán)節(jié)。
▲OK Computer工作界面,左側(cè)為聊天框,右側(cè)為虛擬電腦(圖源:智東西)
與傳統(tǒng)依賴人工預(yù)設(shè)工作流的方式不同,OK Computer背后是月之暗面的原生Agent模型Kimi K2,能應(yīng)對(duì)更多任務(wù)場(chǎng)景和突發(fā)情況。
借助端到端強(qiáng)化學(xué)習(xí)技術(shù),Kimi K2掌握了文件系統(tǒng)、瀏覽器、終端、代碼、圖片生成、音頻生成等20多種工具的使用方式,擁有完成復(fù)雜任務(wù)所需的內(nèi)在知識(shí)。
官方Demo中,OK Computer能夠直接交付功能模塊豐富的多頁(yè)面網(wǎng)站、移動(dòng)端友好的Web應(yīng)用以及可編輯的高品質(zhì)演示文稿等產(chǎn)出物,也能夠把幾十萬(wàn)行的Excel 數(shù)據(jù)進(jìn)行可視化、交互式呈現(xiàn)。
目前,過(guò)去兩年曾經(jīng)給予Kimi打賞鼓勵(lì)的用戶,將優(yōu)先獲得OK Computer的體驗(yàn)席位,這部分用戶打開(kāi)網(wǎng)頁(yè)版Kimi即可收到邀請(qǐng)。
月之暗面稱,Agent模式下單個(gè)任務(wù)的token消耗量可達(dá)常規(guī)對(duì)話模式的幾十倍,OK Computer會(huì)根據(jù)服務(wù)器負(fù)載情況逐步擴(kuò)大灰度測(cè)試范圍。智東西也對(duì)OK Computer的表現(xiàn)進(jìn)行了體驗(yàn)。
一、一手體驗(yàn)海量數(shù)據(jù)分析能力,把英偉達(dá)投資策略捋清了
獲得OK Computer模式體驗(yàn)機(jī)會(huì)的用戶,在Kimi首頁(yè)輸入框的左下角能找到OK Computer模式的切換按鈕,點(diǎn)擊后即可使用。
官方提供了OK Computer模式下的一些模板提示詞,如果想體驗(yàn)其能力,又不愿意撰寫(xiě)復(fù)雜提示詞,可以直接選用這些模板。
智東西從中選擇了一項(xiàng)數(shù)據(jù)可視化任務(wù),要求Kimi從雅虎財(cái)經(jīng)獲取英偉達(dá)過(guò)去兩年的股價(jià)和財(cái)報(bào)數(shù)據(jù),并分析股價(jià)的暴漲是否主要發(fā)生在財(cái)報(bào)發(fā)布前后、比較估值(市盈率P/E)與標(biāo)普500科技板塊的平均值。
此外,Kimi還需模擬在每次財(cái)報(bào)發(fā)布前一周買入,發(fā)布后一周賣出的交易策略,長(zhǎng)期來(lái)看是否盈利。
設(shè)計(jì)風(fēng)格方面,提示詞要求Kimi采用低飽和度的英偉達(dá)品牌色,保持布局簡(jiǎn)潔和諧,僅使用純色(無(wú)漸變),并通過(guò)優(yōu)雅圖標(biāo)提升清晰度。
收到任務(wù)后,Kimi會(huì)在右側(cè)呈現(xiàn)它在虛擬電腦中進(jìn)行的各類操作。在開(kāi)始任務(wù)之前,它一般會(huì)撰寫(xiě)待辦事項(xiàng),對(duì)任務(wù)流程進(jìn)行全面規(guī)劃,然后再正式執(zhí)行。
開(kāi)啟OK Computer模式后,Kimi會(huì)列出其進(jìn)行的每一步操作,包括使用數(shù)據(jù)源、使用文件、使用iPython、使用部署工具等等。分析完成后,它還用簡(jiǎn)潔的語(yǔ)言給出了關(guān)鍵發(fā)現(xiàn),并將分析圖表和結(jié)論做成了一個(gè)完整的網(wǎng)站,耗時(shí)5分鐘左右。
生成結(jié)果:
https://www.kimi.com/share/19988a15-7962-8c6a-8000-0000857b187e
可以看到,Kimi給出的網(wǎng)頁(yè)完成度較高,數(shù)據(jù)可視化清晰,跳轉(zhuǎn)邏輯正確,還提供了JSON格式的分析數(shù)據(jù)。
智東西核驗(yàn)了頁(yè)面中部分關(guān)鍵數(shù)據(jù)的正確性,如英偉達(dá)市值、股價(jià)等等。在我們的抽查范圍內(nèi),數(shù)據(jù)基本無(wú)誤,不過(guò)英偉達(dá)的市盈率與雅虎財(cái)經(jīng)上顯示的數(shù)據(jù)有出入。
這一任務(wù)考察的能力類型眾多,OK Computer模式下的Kimi需要從指定來(lái)源抓取正確數(shù)據(jù)和對(duì)應(yīng)時(shí)間,理解提示詞中談到的各種金融術(shù)語(yǔ),還需要利用Python進(jìn)行數(shù)據(jù)分析,并將結(jié)果按照風(fēng)格要求可視化。如果是人工完成,可能需要耗費(fèi)數(shù)小時(shí)。
我們將官方提示詞中的企業(yè)從英偉達(dá)改為AMD,切換了比較的基準(zhǔn),Kimi同樣能給出類似質(zhì)量的分析結(jié)果,這在某種程度上也印證了其能力不是完全靠“背題”實(shí)現(xiàn)的。
生成結(jié)果:
https://www.kimi.com/share/19988bb0-9b82-864d-8000-0000e74d03a4
不過(guò),OK Computer并不是市面上唯一一款具備類似能力的Agent,我們也將這一任務(wù)交給了Manus。
可以看到,Manus的執(zhí)行風(fēng)格更偏向直接上手做,收到任務(wù)后直接就開(kāi)始查詢財(cái)經(jīng)數(shù)據(jù)的API了。Manus最終交付了一份MarkDown文檔,以及四張數(shù)據(jù)圖表。
Manus的報(bào)告內(nèi)容更為宏觀,在具體數(shù)據(jù)的呈現(xiàn)上比OK Computer更少,報(bào)告長(zhǎng)度也更短,任務(wù)耗時(shí)比OK Computer長(zhǎng)。數(shù)據(jù)可視化方面,其圖表的美觀程度和OK Computer相比還有一定差距。
二、擅長(zhǎng)PPT、多功能網(wǎng)站開(kāi)發(fā),多位網(wǎng)友給出好評(píng)
月之暗面介紹,OK Computer已掌握的工具集包括列待辦事項(xiàng)、寫(xiě)Python代碼、操作終端、瀏覽網(wǎng)頁(yè)、文字搜索、圖片搜索、圖片生成、音頻生成、接入專業(yè)財(cái)經(jīng)數(shù)據(jù)源、網(wǎng)站部署等。
在該公司的內(nèi)部測(cè)試中,OK Computer目前擅長(zhǎng)的任務(wù)類型,包括多功能網(wǎng)站原型開(kāi)發(fā)、海量數(shù)據(jù)分析與可視化、高品質(zhì)演示PPT制作等。
x平臺(tái)上的一名科技博主分享,他用OK Computer打造了一個(gè)功能完備的星座網(wǎng)站。這個(gè)網(wǎng)站可以幫助用戶了解每個(gè)星座的特征,還可以比較兩個(gè)星座之間是否匹配。其設(shè)計(jì)風(fēng)格也與網(wǎng)站的主題較為匹配。
▲OK Computer生成的星座網(wǎng)站(圖源:Gadgetify)
還有網(wǎng)友分享,自己用OK Computer打造了一個(gè)文檔比較網(wǎng)站,可以看到這一網(wǎng)站設(shè)計(jì)簡(jiǎn)潔美觀,這位網(wǎng)友反饋完成率還不錯(cuò)。
官方Demo中,借助OK Computer,Kimi還打造了一份對(duì)電影《2001太空漫游》視覺(jué)元素的深度解析PPT,要求僅使用電影原圖與影視和學(xué)術(shù)深度解析文章。
Kimi會(huì)先設(shè)定計(jì)劃,搜索電影原圖素材和關(guān)鍵場(chǎng)景的圖片,搜索電影深度解釋和學(xué)術(shù)研究資料,經(jīng)過(guò)深度研究和素材資料收集,然后才開(kāi)始按照視覺(jué)規(guī)范制作PPT。
最終,Kimi可以交付一份演示文稿,既可以在線分享,也可以下載到本地。
結(jié)語(yǔ):從問(wèn)答機(jī)器到全棧開(kāi)發(fā),大模型競(jìng)逐Agent能力
月之暗面稱,未來(lái)他們會(huì)為OK Computer模式帶來(lái)更豐富的工具選項(xiàng)和自定義工具能力,也支持連接更多外部應(yīng)用,讓Kimi可以完成更多類型的任務(wù)。
這也順應(yīng)了行業(yè)內(nèi)的一大趨勢(shì):通用大模型正從知識(shí)問(wèn)答階段、生產(chǎn)力工具階段邁向通用Agent階段。未來(lái),誰(shuí)能率先在工具生態(tài)整合、長(zhǎng)時(shí)任務(wù)執(zhí)行、可靠性和合規(guī)性上建立優(yōu)勢(shì),誰(shuí)就可能在新一輪競(jìng)爭(zhēng)中占據(jù)先機(jī)。
