凯时AG

环球热门新闻资讯
2026-06-14 17:48:28
首页 > 新闻 > 时政要闻 > 正文

测完几个Agent工具,, ,,我发明他们能代打游戏了

发个指令,, ,,给点权限,, ,,AI就能自己翻开游戏库库玩了。。。 。

不懂咋玩?????那就截图识别。。。 。没法操作?????直接现搓剧本。。。 。操作一坨?????甚至还能上网自己找攻略。。。 。

这就是现在跑在你电脑上的 AI Agent 能做到的事儿。。。 。

世超把市面上的一些 Agent 工具测了一遍,, ,,好比Codex,, ,,TRAE,, ,,QoderWork,, ,,Workbuddy,, ,,Marvis等等。。。 。

只能说,, ,,这玩意儿吹了这么久,, ,,大伙儿可能真不必再张望了。。。 。

从左向右依次为:第一行WorkBuddy,, ,,TRAE,, ,,Marvis;;;;第二行Codex,, ,,QoderWork,, ,,悟空

虽然,, ,,一听 code 啥的,, ,,大伙儿可能以为是为专业开发者造的,, ,,门槛高,, ,,学起来用起来会很贫困。。。 。

诶,, ,,莫担心,, ,,大厂们也都悄摸进化一轮了。。。 。

之前确实硬核了点,, ,,一个两个的都照搬 VS Code 那种古板的编程页面,, ,,适合开发,, ,,但并不适合和 AI 一起开发。。。 。

VS Code页面

既然引入 Agent 了,, ,, 那肯定得重新设计,, ,,事实它是来干活的,, ,,而人是监视它的。。。 。

以是各人都很默契地改了统一套交互逻辑,, ,,把详细的代码隐去,, ,,再把 Agent 干活儿时的日志显示出来。。。 。

在网页里你可以叫它先生,, ,,但在 Agent 工具里,, ,,你得化身老板,, ,,把活儿给摊派明确。。。 。

咱先来看界面,, ,,也很精练,, ,,主要三个部分。。。 。

左边是你手底下掌管的项目,, ,,中心是通例的谈天窗口,, ,,右边就能看到期待验收的工具了 ( 一般等事情最先了才会有新闻 )。。。 。

向左滑动,, ,,依次为:Codex,, ,,TRAE,, ,,WorkBuddy,, ,,Qoderwork

能 BB 就不下手,, ,,咱先去 Agent 工具的 “ 应用市肆 ” 里走走,, ,,看看有啥合适的手艺包,, ,,也就是 Skill,, ,,给 Agent 装上左膀右臂。。。 。

能看到,, ,,琳琅满目。。。 。, ,,事实活儿的种类也就那么多,, ,,以是但凡著名有姓的基本都能扒拉到现成的方案。。。 。

什么数据剖析,, ,,内容创作都不在话下,, ,,虽然不至于个个都好用,, ,,但参考参考终归是能少走点弯路的。。。 。

其中做的较量有新意的是腾讯新出的 Marvis,, ,,把手艺市肆做成了类似小红书的信息流,, ,,可以边刷边珍藏手艺。。。 。

再加上手艺在这些工具里是通用的,, ,,以是最近小红书自己也上线了 Skill 市肆,, ,,用起来也相当利便。。。 。

虽然,, ,,就算挑不过来也没关系,, ,,手艺市肆里尚有帮咱选手艺的手艺。。。 。

Codex 里叫 Skill Installer,, ,,WorkBuddy 里叫 Find Skills,, ,,算是将懒人式举行究竟。。。 。

左:Codex;;;;右:WorkBuddy

至于自己造手艺倒是不必急,, ,,虽然可以通过 AI 一步步指导造出来,, ,,但先射箭后画靶一般都欠好使。。。 。

好的手艺往往是先自己跑通几遍,, ,,再提炼总结,, ,,会更接地气,, ,,也更贴合自己的使用场景。。。 。

向左滑动,, ,,依次为:WorkBuddy,, ,,TRAE

选好手艺就可以最先使命了,, ,,这里在最先前需要选一下使命类型,, ,,默认的是通俗款,, ,,但一般 Plan 模式更好使。。。 。

这点还挺主要的,, ,,由于许多时间效果不睬想不是 Agent 太笨了,, ,,而是咱自己也不知道想要什么。。。 。

这个 Plan 就是在使命最先前先计齐整下,, ,,明确使命的条条框框。。。 。

有什么不当就直接改了,, ,,不必比及最后才发明偏向跑偏了。。。 。

简朴说一下咱要做什么,, ,,就能敲回车下发指令了。。。 。

为了看详细流程,, ,,咱挑 3 个幸运儿来展示一下,, ,,OpenAI 的 Codex,, ,,字节的 TRAE 和 腾讯的 WorkBuddy,, ,,海内外的都拉出来溜溜。。。 。

使命就原地 TP,, ,,让它们仨锐评它们仨。。。 。

此时就能发明 Plan 的利益了,, ,,好比执行使命前,, ,,Codex 和 TRAE 都向我二次确认了下 WorkBuddy 详细是哪一个,, ,,由于外洋有同名的应用,, ,,容易混淆。。。 。

虽然,, ,,由于都是默认的模子,, ,,速率有快有慢,, ,,但就报告效果来看,, ,,确实各有 “ 特点 ” 呐。。。 。

先说 WorkBuddy,, ,,给到一个忠实人,, ,,上来也没问我报告是个啥形式,, ,,吭哧吭哧就是干。。。 。

最后给的网页,, ,,就效果来看,, ,,照旧不错的,, ,,排版和内容虽然 AI 味道重了点,, ,,但花里胡哨的切合咱锐评的主基调。。。 。

并且调研后的结论相当低调,, ,,把自己放在了靠后的位置,, ,,喷起自己绝不手软,, ,,实诚这一块儿到位了。。。 。

再来看 TRAE ,, ,,给到一个人上人,, ,,活儿干的较量详尽,, ,,不管是前期的弹出式的表单妄想,, ,,照旧中心的调研,, ,,思绪都很清晰,, ,,子 Agent 的挪用也是相当熟练了。。。 。

焦点结论里,, ,,虽然把自己排到了老大,, ,,但考量了 6 个维度,, ,,总分是加权出来的,, ,,也算是有理有据了。。。 。

最后的 Codex,, ,,基本就是现在这个领域的标杆了,, ,,报告里先来一手信源剖析,, ,,就跟大伙儿拉开了点距离,, ,,下面的评价也能显着感受到更深入一些,, ,,连系了官方产品文档的内容。。。 。

模子好确实有优势,, ,,但思量到海内用起来不利便,, ,,暂且给到一个半夯吧。。。 。

接下来,, ,,使命继续,, ,,让他们把各自的报告天生一份可视化的落地页。。。 。

你可能会说这活儿在网页里也能做,, ,,并且还更快。。。 。

倒也没错,, ,,但差别的点在于,, ,,这里你不需要把代码再复制粘贴到外地了,, ,,并且最主要的,, ,,Agent 会自己挪用工具,, ,,去检查制品有没有 BUG。。。 。

好比同样的使命,, ,,交给网页的 Gemini,, ,,这家伙甩给我几百行代码,, ,,我粘到外地翻开,, ,,发明一片空缺。。。 。。。。 。。。。 。

而这些 Agent 会在交付之前就阻止这种情形。。。 。

WorkBuddy 是自己挪用了 3 次预览,, ,,做了 2 次优化,, ,,才把网页交给我。。。 。

TRAE 直接一些,, ,,直接翻开了内置的浏览器,, ,,通过差别角度的截图识别,, ,,打不开就刷新重试,, ,,直到确认渲染效果切合预期。。。 。

Codex 也一样,, ,, 权限不敷,, ,,总是截不着网页,, ,,试了 N 次才确认好效果。。。 。

以是落地页的效果倒是其次,, ,,重点是这套使命执行的逻辑,, ,,是跟网页端应付交差完全差别的打法。。。 。

特殊是截图反馈的工具挪用,, ,,相当于给电脑安了个赛博义眼。。。 。

而像 Codex 这种更进一步,, ,,有 Computer Use 功效,, ,,可以全局截图反。。。 。, ,,然后操作。。。 。相当于你电脑上的软件,, ,,它都能翻开,, ,,等模子能力更猛了,, ,,代打几局 LOL 也不是不可能。。。 。

虽然,, ,,除了手艺 skill,, ,,这些 Agent 工具还能接入其他应用,, ,,像是 GitHub,, ,,邮箱,, ,,网盘等。。。 。

更妙的是接入一些通讯软件,, ,,像微信,, ,,飞书,, ,,这也是龙虾当初火起来的一大原因。。。 。

接入后就能双向链接,, ,,甭管是从 Agent 往飞书发文档,, ,,照旧从微信下令 Agent 往工位上下载资料,, ,,都没问题。。。 。

像是之前远程软件的升级版,, ,,加了个 Agent 当管家,, ,,帮你 24 小时盯着自己的电脑,, ,,随叫随到。。。 。

或者有一些准时的使命,, ,,也能找到 “ 自动化 ” 这种类型的入口,, ,,让它接受天天死板重复的流程性使命。。。 。

向左滑动,, ,,依次为:Codex,, ,,TRAE,, ,,WorkBuddy,, ,,Marvis

说了这么多,, ,,着实无论是什么手段,, ,,装什么插件,, ,,实质上都是在约束,, ,,控制着 Agent 朝咱预定的偏向产出工具。。。 。

有大佬全心优化的事情流,, ,,有厂商调教好的影象系统,, ,,也有利便适用的手艺包。。。 。

用专业点的话说这些都是 “ Harness ”,, ,,原意是给马套上马具,, ,,放这儿也是很是贴切了。。。 。

无论马具下面的模子是哪一匹,, ,,这些 Agent 工具都得随套随用。。。 。

就用起来的体感而言,, ,,Codex 是较量夯的,, ,,模子给力,, ,,额度还无意重制,, ,,虽然需要一点手段,, ,,但比起 Claude 要简朴得多,, ,,适合想体验顶尖性能的折腾党。。。 。

要是不想贫困,, ,,直接用海内大厂的方案也行,, ,,嫌默认的模子笨,, ,,就去买点 DeepSeek 的 API 接上,, ,,也是妥妥的性价比平替。。。 。

至于平替内里选哪一个就取决于你的使用场景了,, ,,微信和 WorkBuddy 搭伙利便,, ,,飞书和 TRAE 集成更深,, ,,钉钉那里就是 Qoder 以及咱没测到的悟空了,, ,,不过逻辑都是一样的。。。 。

但话说回来,, ,,Agent 工具也是有弱点的,, ,,就是上的手段越多,, ,,破费的模子 Token 也越多,, ,,动不动几十分钟的长线使命,, ,,账单会变得贼拉长。。。 。

以是有什么自制管饱的模子套餐,, ,,大伙儿就各显神通吧。。。 。。。。 。。。。 。

而要是不太繁琐的活儿,, ,,这些 Agent 工具也有免费的额度,, ,,白嫖一下尝尝咸淡总是不亏的。。。 。

撰文:风华

编辑:江江 & 面线

美编:焕妍

图片、资料泉源:

Codex, TRAE, WorkBuddy, Marvis,, ,,QoderWork,, ,,悟空

2025年1月,, ,,宁波余姚市公安机关在事情中发明,, ,,辖区某电商科技公司因未做好数据清静;;;;な虑椋, ,,导致后台客户身份数据被泄露,, ,,并被中心商转卖至贷款引流、催收等环节。。。 。同年1月至7月,, ,,余姚公何在内蒙古通辽、江苏泰州、山东泰安等地抓获犯罪嫌疑人12名。。。 。

责任编辑:杨于义

【网站地图】