测完几个Agent工具,,,,,,我发明他们能代打游戏了
发个指令,,,,,,给点权限,,,,,,AI就能自己翻开游戏库库玩了。。。。。。
不懂咋玩?????那就截图识别。。。。。。没法操作?????直接现搓剧本。。。。。。操作一坨?????甚至还能上网自己找攻略。。。。。。
这就是现在跑在你电脑上的 AI Agent 能做到的事儿。。。。。。
世超把市面上的一些 Agent 工具测了一遍,,,,,,好比Codex,,,,,,TRAE,,,,,,QoderWork,,,,,,Workbuddy,,,,,,Marvis等等。。。。。。
只能说,,,,,,这玩意儿吹了这么久,,,,,,大伙儿可能真不必再张望了。。。。。。
从左向右依次为:第一行WorkBuddy,,,,,,TRAE,,,,,,Marvis;;第二行Codex,,,,,,QoderWork,,,,,,悟空
虽然,,,,,,一听 code 啥的,,,,,,大伙儿可能以为是为专业开发者造的,,,,,,门槛高,,,,,,学起来用起来会很贫困。。。。。。
诶,,,,,,莫担心,,,,,,大厂们也都悄摸进化一轮了。。。。。。
之前确实硬核了点,,,,,,一个两个的都照搬 VS Code 那种古板的编程页面,,,,,,适合开发,,,,,,但并不适合和 AI 一起开发。。。。。。
VS Code页面
既然引入 Agent 了,,,,,, 那肯定得重新设计,,,,,,事实它是来干活的,,,,,,而人是监视它的。。。。。。
以是各人都很默契地改了统一套交互逻辑,,,,,,把详细的代码隐去,,,,,,再把 Agent 干活儿时的日志显示出来。。。。。。
在网页里你可以叫它先生,,,,,,但在 Agent 工具里,,,,,,你得化身老板,,,,,,把活儿给摊派明确。。。。。。
咱先来看界面,,,,,,也很精练,,,,,,主要三个部分。。。。。。
左边是你手底下掌管的项目,,,,,,中心是通例的谈天窗口,,,,,,右边就能看到期待验收的工具了 ( 一般等事情最先了才会有新闻 )。。。。。。
向左滑动,,,,,,依次为:Codex,,,,,,TRAE,,,,,,WorkBuddy,,,,,,Qoderwork
能 BB 就不下手,,,,,,咱先去 Agent 工具的 “ 应用市肆 ” 里走走,,,,,,看看有啥合适的手艺包,,,,,,也就是 Skill,,,,,,给 Agent 装上左膀右臂。。。。。。
能看到,,,,,,琳琅满目啊,,,,,,事实活儿的种类也就那么多,,,,,,以是但凡著名有姓的基本都能扒拉到现成的方案。。。。。。
什么数据剖析,,,,,,内容创作都不在话下,,,,,,虽然不至于个个都好用,,,,,,但参考参考终归是能少走点弯路的。。。。。。
其中做的较量有新意的是腾讯新出的 Marvis,,,,,,把手艺市肆做成了类似小红书的信息流,,,,,,可以边刷边珍藏手艺。。。。。。
再加上手艺在这些工具里是通用的,,,,,,以是最近小红书自己也上线了 Skill 市肆,,,,,,用起来也相当利便。。。。。。
虽然,,,,,,就算挑不过来也没关系,,,,,,手艺市肆里尚有帮咱选手艺的手艺。。。。。。
Codex 里叫 Skill Installer,,,,,,WorkBuddy 里叫 Find Skills,,,,,,算是将懒人式举行究竟。。。。。。
左:Codex;;右:WorkBuddy
至于自己造手艺倒是不必急,,,,,,虽然可以通过 AI 一步步指导造出来,,,,,,但先射箭后画靶一般都欠好使。。。。。。
好的手艺往往是先自己跑通几遍,,,,,,再提炼总结,,,,,,会更接地气,,,,,,也更贴合自己的使用场景。。。。。。
向左滑动,,,,,,依次为:WorkBuddy,,,,,,TRAE
选好手艺就可以最先使命了,,,,,,这里在最先前需要选一下使命类型,,,,,,默认的是通俗款,,,,,,但一般 Plan 模式更好使。。。。。。
这点还挺主要的,,,,,,由于许多时间效果不睬想不是 Agent 太笨了,,,,,,而是咱自己也不知道想要什么。。。。。。
这个 Plan 就是在使命最先前先计齐整下,,,,,,明确使命的条条框框。。。。。。
有什么不当就直接改了,,,,,,不必比及最后才发明偏向跑偏了。。。。。。
简朴说一下咱要做什么,,,,,,就能敲回车下发指令了。。。。。。
为了看详细流程,,,,,,咱挑 3 个幸运儿来展示一下,,,,,,OpenAI 的 Codex,,,,,,字节的 TRAE 和 腾讯的 WorkBuddy,,,,,,海内外的都拉出来溜溜。。。。。。
使命就原地 TP,,,,,,让它们仨锐评它们仨。。。。。。
此时就能发明 Plan 的利益了,,,,,,好比执行使命前,,,,,,Codex 和 TRAE 都向我二次确认了下 WorkBuddy 详细是哪一个,,,,,,由于外洋有同名的应用,,,,,,容易混淆。。。。。。
虽然,,,,,,由于都是默认的模子,,,,,,速率有快有慢,,,,,,但就报告效果来看,,,,,,确实各有 “ 特点 ” 呐。。。。。。
先说 WorkBuddy,,,,,,给到一个忠实人,,,,,,上来也没问我报告是个啥形式,,,,,,吭哧吭哧就是干。。。。。。
最后给的网页,,,,,,就效果来看,,,,,,照旧不错的,,,,,,排版和内容虽然 AI 味道重了点,,,,,,但花里胡哨的切合咱锐评的主基调。。。。。。
并且调研后的结论相当低调,,,,,,把自己放在了靠后的位置,,,,,,喷起自己绝不手软,,,,,,实诚这一块儿到位了。。。。。。
再来看 TRAE ,,,,,,给到一个人上人,,,,,,活儿干的较量详尽,,,,,,不管是前期的弹出式的表单妄想,,,,,,照旧中心的调研,,,,,,思绪都很清晰,,,,,,子 Agent 的挪用也是相当熟练了。。。。。。
焦点结论里,,,,,,虽然把自己排到了老大,,,,,,但考量了 6 个维度,,,,,,总分是加权出来的,,,,,,也算是有理有据了。。。。。。
最后的 Codex,,,,,,基本就是现在这个领域的标杆了,,,,,,报告里先来一手信源剖析,,,,,,就跟大伙儿拉开了点距离,,,,,,下面的评价也能显着感受到更深入一些,,,,,,连系了官方产品文档的内容。。。。。。
模子好确实有优势,,,,,,但思量到海内用起来不利便,,,,,,暂且给到一个半夯吧。。。。。。
接下来,,,,,,使命继续,,,,,,让他们把各自的报告天生一份可视化的落地页。。。。。。
你可能会说这活儿在网页里也能做,,,,,,并且还更快。。。。。。
倒也没错,,,,,,但差别的点在于,,,,,,这里你不需要把代码再复制粘贴到外地了,,,,,,并且最主要的,,,,,,Agent 会自己挪用工具,,,,,,去检查制品有没有 BUG。。。。。。
好比同样的使命,,,,,,交给网页的 Gemini,,,,,,这家伙甩给我几百行代码,,,,,,我粘到外地翻开,,,,,,发明一片空缺。。。。。。。。。。。。。。。。。。
而这些 Agent 会在交付之前就阻止这种情形。。。。。。
WorkBuddy 是自己挪用了 3 次预览,,,,,,做了 2 次优化,,,,,,才把网页交给我。。。。。。
TRAE 直接一些,,,,,,直接翻开了内置的浏览器,,,,,,通过差别角度的截图识别,,,,,,打不开就刷新重试,,,,,,直到确认渲染效果切合预期。。。。。。
Codex 也一样,,,,,, 权限不敷,,,,,,总是截不着网页,,,,,,试了 N 次才确认好效果。。。。。。
以是落地页的效果倒是其次,,,,,,重点是这套使命执行的逻辑,,,,,,是跟网页端应付交差完全差别的打法。。。。。。
特殊是截图反馈的工具挪用,,,,,,相当于给电脑安了个赛博义眼。。。。。。
而像 Codex 这种更进一步,,,,,,有 Computer Use 功效,,,,,,可以全局截图反馈,,,,,,然后操作。。。。。。相当于你电脑上的软件,,,,,,它都能翻开,,,,,,等模子能力更猛了,,,,,,代打几局 LOL 也不是不可能。。。。。。
虽然,,,,,,除了手艺 skill,,,,,,这些 Agent 工具还能接入其他应用,,,,,,像是 GitHub,,,,,,邮箱,,,,,,网盘等。。。。。。
更妙的是接入一些通讯软件,,,,,,像微信,,,,,,飞书,,,,,,这也是龙虾当初火起来的一大原因。。。。。。
接入后就能双向链接,,,,,,甭管是从 Agent 往飞书发文档,,,,,,照旧从微信下令 Agent 往工位上下载资料,,,,,,都没问题。。。。。。
像是之前远程软件的升级版,,,,,,加了个 Agent 当管家,,,,,,帮你 24 小时盯着自己的电脑,,,,,,随叫随到。。。。。。
或者有一些准时的使命,,,,,,也能找到 “ 自动化 ” 这种类型的入口,,,,,,让它接受天天死板重复的流程性使命。。。。。。
向左滑动,,,,,,依次为:Codex,,,,,,TRAE,,,,,,WorkBuddy,,,,,,Marvis
说了这么多,,,,,,着实无论是什么手段,,,,,,装什么插件,,,,,,实质上都是在约束,,,,,,控制着 Agent 朝咱预定的偏向产出工具。。。。。。
有大佬全心优化的事情流,,,,,,有厂商调教好的影象系统,,,,,,也有利便适用的手艺包。。。。。。
用专业点的话说这些都是 “ Harness ”,,,,,,原意是给马套上马具,,,,,,放这儿也是很是贴切了。。。。。。
无论马具下面的模子是哪一匹,,,,,,这些 Agent 工具都得随套随用。。。。。。
就用起来的体感而言,,,,,,Codex 是较量夯的,,,,,,模子给力,,,,,,额度还无意重制,,,,,,虽然需要一点手段,,,,,,但比起 Claude 要简朴得多,,,,,,适合想体验顶尖性能的折腾党。。。。。。
要是不想贫困,,,,,,直接用海内大厂的方案也行,,,,,,嫌默认的模子笨,,,,,,就去买点 DeepSeek 的 API 接上,,,,,,也是妥妥的性价比平替。。。。。。
至于平替内里选哪一个就取决于你的使用场景了,,,,,,微信和 WorkBuddy 搭伙利便,,,,,,飞书和 TRAE 集成更深,,,,,,钉钉那里就是 Qoder 以及咱没测到的悟空了,,,,,,不过逻辑都是一样的。。。。。。
但话说回来,,,,,,Agent 工具也是有弱点的,,,,,,就是上的手段越多,,,,,,破费的模子 Token 也越多,,,,,,动不动几十分钟的长线使命,,,,,,账单会变得贼拉长。。。。。。
以是有什么自制管饱的模子套餐,,,,,,大伙儿就各显神通吧。。。。。。。。。。。。。。。。。。
而要是不太繁琐的活儿,,,,,,这些 Agent 工具也有免费的额度,,,,,,白嫖一下尝尝咸淡总是不亏的。。。。。。
撰文:风华
编辑:江江 & 面线
美编:焕妍
图片、资料泉源:
Codex, TRAE, WorkBuddy, Marvis,,,,,,QoderWork,,,,,,悟空
@黄秀峰:79日本XXXXXXXX79,,,,,,习近平同塞尔维亚总统武契奇谈判@阮政亦:文班亚马中选西部决赛MVP
@陈秋绍:樊振东20分钟横扫敌手晋级欧冠决赛
热门排行
- 1 pornhub免费版
- 2 99久久
- 3 高清一二三区
- 4 ph色情
- 5 性A
- 6 侃楠小雨
- 7 李毅吧动态第400
- 8 App美女脱光衣服
- 9 陈美娇啊我太爱你了txt