凯时AG

环球热门新闻资讯
2026-06-14 21:40:53
首页 > 新闻 > 时政要闻 > 正文

测完几个Agent工具,,,我发明他们能代打游戏了

发个指令,,,给点权限,,,AI就能自己翻开游戏库库玩了。。 。。

不懂咋玩????那就截图识别。。 。。没法操作????直接现搓剧本。。 。。操作一坨????甚至还能上网自己找攻略。。 。。

这就是现在跑在你电脑上的 AI Agent 能做到的事儿。。 。。

世超把市面上的一些 Agent 工具测了一遍,,,好比Codex,,,TRAE,,,QoderWork,,,Workbuddy,,,Marvis等等。。 。。

只能说,,,这玩意儿吹了这么久,,,大伙儿可能真不必再张望了。。 。。

从左向右依次为:第一行WorkBuddy,,,TRAE,,,Marvis;; ;;;第二行Codex,,,QoderWork,,,悟空

虽然,,,一听 code 啥的,,,大伙儿可能以为是为专业开发者造的,,,门槛高,,,学起来用起来会很贫困。。 。。

诶,,,莫担心,,,大厂们也都悄摸进化一轮了。。 。。

之前确实硬核了点,,,一个两个的都照搬 VS Code 那种古板的编程页面,,,适合开发,,,但并不适合和 AI 一起开发。。 。。

VS Code页面

既然引入 Agent 了,,, 那肯定得重新设计,,,事实它是来干活的,,,而人是监视它的。。 。。

以是各人都很默契地改了统一套交互逻辑,,,把详细的代码隐去,,,再把 Agent 干活儿时的日志显示出来。。 。。

在网页里你可以叫它先生,,,但在 Agent 工具里,,,你得化身老板,,,把活儿给摊派明确。。 。。

咱先来看界面,,,也很精练,,,主要三个部分。。 。。

左边是你手底下掌管的项目,,,中心是通例的谈天窗口,,,右边就能看到期待验收的工具了 ( 一般等事情最先了才会有新闻 )。。 。。

向左滑动,,,依次为:Codex,,,TRAE,,,WorkBuddy,,,Qoderwork

能 BB 就不下手,,,咱先去 Agent 工具的 “ 应用市肆 ” 里走走,,,看看有啥合适的手艺包,,,也就是 Skill,,,给 Agent 装上左膀右臂。。 。。

能看到,,,琳琅满目啊,,,事实活儿的种类也就那么多,,,以是但凡著名有姓的基本都能扒拉到现成的方案。。 。。

什么数据剖析,,,内容创作都不在话下,,,虽然不至于个个都好用,,,但参考参考终归是能少走点弯路的。。 。。

其中做的较量有新意的是腾讯新出的 Marvis,,,把手艺市肆做成了类似小红书的信息流,,,可以边刷边珍藏手艺。。 。。

再加上手艺在这些工具里是通用的,,,以是最近小红书自己也上线了 Skill 市肆,,,用起来也相当利便。。 。。

虽然,,,就算挑不过来也没关系,,,手艺市肆里尚有帮咱选手艺的手艺。。 。。

Codex 里叫 Skill Installer,,,WorkBuddy 里叫 Find Skills,,,算是将懒人式举行究竟。。 。。

左:Codex;; ;;;右:WorkBuddy

至于自己造手艺倒是不必急,,,虽然可以通过 AI 一步步指导造出来,,,但先射箭后画靶一般都欠好使。。 。。

好的手艺往往是先自己跑通几遍,,,再提炼总结,,,会更接地气,,,也更贴合自己的使用场景。。 。。

向左滑动,,,依次为:WorkBuddy,,,TRAE

选好手艺就可以最先使命了,,,这里在最先前需要选一下使命类型,,,默认的是通俗款,,,但一般 Plan 模式更好使。。 。。

这点还挺主要的,,,由于许多时间效果不睬想不是 Agent 太笨了,,,而是咱自己也不知道想要什么。。 。。

这个 Plan 就是在使命最先前先计齐整下,,,明确使命的条条框框。。 。。

有什么不当就直接改了,,,不必比及最后才发明偏向跑偏了。。 。。

简朴说一下咱要做什么,,,就能敲回车下发指令了。。 。。

为了看详细流程,,,咱挑 3 个幸运儿来展示一下,,,OpenAI 的 Codex,,,字节的 TRAE 和 腾讯的 WorkBuddy,,,海内外的都拉出来溜溜。。 。。

使命就原地 TP,,,让它们仨锐评它们仨。。 。。

此时就能发明 Plan 的利益了,,,好比执行使命前,,,Codex 和 TRAE 都向我二次确认了下 WorkBuddy 详细是哪一个,,,由于外洋有同名的应用,,,容易混淆。。 。。

虽然,,,由于都是默认的模子,,,速率有快有慢,,,但就报告效果来看,,,确实各有 “ 特点 ” 呐。。 。。

先说 WorkBuddy,,,给到一个忠实人,,,上来也没问我报告是个啥形式,,,吭哧吭哧就是干。。 。。

最后给的网页,,,就效果来看,,,照旧不错的,,,排版和内容虽然 AI 味道重了点,,,但花里胡哨的切合咱锐评的主基调。。 。。

并且调研后的结论相当低调,,,把自己放在了靠后的位置,,,喷起自己绝不手软,,,实诚这一块儿到位了。。 。。

再来看 TRAE ,,,给到一个人上人,,,活儿干的较量详尽,,,不管是前期的弹出式的表单妄想,,,照旧中心的调研,,,思绪都很清晰,,,子 Agent 的挪用也是相当熟练了。。 。。

焦点结论里,,,虽然把自己排到了老大,,,但考量了 6 个维度,,,总分是加权出来的,,,也算是有理有据了。。 。。

最后的 Codex,,,基本就是现在这个领域的标杆了,,,报告里先来一手信源剖析,,,就跟大伙儿拉开了点距离,,,下面的评价也能显着感受到更深入一些,,,连系了官方产品文档的内容。。 。。

模子好确实有优势,,,但思量到海内用起来不利便,,,暂且给到一个半夯吧。。 。。

接下来,,,使命继续,,,让他们把各自的报告天生一份可视化的落地页。。 。。

你可能会说这活儿在网页里也能做,,,并且还更快。。 。。

倒也没错,,,但差别的点在于,,,这里你不需要把代码再复制粘贴到外地了,,,并且最主要的,,,Agent 会自己挪用工具,,,去检查制品有没有 BUG。。 。。

好比同样的使命,,,交给网页的 Gemini,,,这家伙甩给我几百行代码,,,我粘到外地翻开,,,发明一片空缺。。 。。。。 。。。。 。。

而这些 Agent 会在交付之前就阻止这种情形。。 。。

WorkBuddy 是自己挪用了 3 次预览,,,做了 2 次优化,,,才把网页交给我。。 。。

TRAE 直接一些,,,直接翻开了内置的浏览器,,,通过差别角度的截图识别,,,打不开就刷新重试,,,直到确认渲染效果切合预期。。 。。

Codex 也一样,,, 权限不敷,,,总是截不着网页,,,试了 N 次才确认好效果。。 。。

以是落地页的效果倒是其次,,,重点是这套使命执行的逻辑,,,是跟网页端应付交差完全差别的打法。。 。。

特殊是截图反馈的工具挪用,,,相当于给电脑安了个赛博义眼。。 。。

而像 Codex 这种更进一步,,,有 Computer Use 功效,,,可以全局截图反馈,,,然后操作。。 。。相当于你电脑上的软件,,,它都能翻开,,,等模子能力更猛了,,,代打几局 LOL 也不是不可能。。 。。

虽然,,,除了手艺 skill,,,这些 Agent 工具还能接入其他应用,,,像是 GitHub,,,邮箱,,,网盘等。。 。。

更妙的是接入一些通讯软件,,,像微信,,,飞书,,,这也是龙虾当初火起来的一大原因。。 。。

接入后就能双向链接,,,甭管是从 Agent 往飞书发文档,,,照旧从微信下令 Agent 往工位上下载资料,,,都没问题。。 。。

像是之前远程软件的升级版,,,加了个 Agent 当管家,,,帮你 24 小时盯着自己的电脑,,,随叫随到。。 。。

或者有一些准时的使命,,,也能找到 “ 自动化 ” 这种类型的入口,,,让它接受天天死板重复的流程性使命。。 。。

向左滑动,,,依次为:Codex,,,TRAE,,,WorkBuddy,,,Marvis

说了这么多,,,着实无论是什么手段,,,装什么插件,,,实质上都是在约束,,,控制着 Agent 朝咱预定的偏向产出工具。。 。。

有大佬全心优化的事情流,,,有厂商调教好的影象系统,,,也有利便适用的手艺包。。 。。

用专业点的话说这些都是 “ Harness ”,,,原意是给马套上马具,,,放这儿也是很是贴切了。。 。。

无论马具下面的模子是哪一匹,,,这些 Agent 工具都得随套随用。。 。。

就用起来的体感而言,,,Codex 是较量夯的,,,模子给力,,,额度还无意重制,,,虽然需要一点手段,,,但比起 Claude 要简朴得多,,,适合想体验顶尖性能的折腾党。。 。。

要是不想贫困,,,直接用海内大厂的方案也行,,,嫌默认的模子笨,,,就去买点 DeepSeek 的 API 接上,,,也是妥妥的性价比平替。。 。。

至于平替内里选哪一个就取决于你的使用场景了,,,微信和 WorkBuddy 搭伙利便,,,飞书和 TRAE 集成更深,,,钉钉那里就是 Qoder 以及咱没测到的悟空了,,,不过逻辑都是一样的。。 。。

但话说回来,,,Agent 工具也是有弱点的,,,就是上的手段越多,,,破费的模子 Token 也越多,,,动不动几十分钟的长线使命,,,账单会变得贼拉长。。 。。

以是有什么自制管饱的模子套餐,,,大伙儿就各显神通吧。。 。。。。 。。。。 。。

而要是不太繁琐的活儿,,,这些 Agent 工具也有免费的额度,,,白嫖一下尝尝咸淡总是不亏的。。 。。

撰文:风华

编辑:江江 & 面线

美编:焕妍

图片、资料泉源:

Codex, TRAE, WorkBuddy, Marvis,,,QoderWork,,,悟空

特朗普提名的下任国家情报总监是谁????

责任编辑:郭芳天

【网站地图】