凯时AG

环球热门新闻资讯
2026-06-15 04:32:10
首页 > 新闻 > 时政要闻 > 正文

果真版Mythos上线,, ,Claude最强模子最先分层发售

Anthropic终于把Mythos推向了果真市场。。。。。, ,但分层发售。。。。。。

破晓,, ,Anthropic正式宣布Claude Fable 5和Claude Mythos 5。。。。。。前者面向通俗用户开放,, ,后者则继续限制在“受信任的清静相助同伴”规模内。。。。。。

新模子的命名可以说很切合Claude一直的气概。。。。。。

从Haiku(俳句)到Sonnet(十四行诗)再到Opus(艺术巨著),, ,Anthropic一直在用文学和艺术看法给模子分层,, ,到了Mythos,, ,名字已经从文学作品膨胀到“神话”自己。。。。。。

Fable来自拉丁语fabula,, ,意思是“被讲述之物”,, ,和希腊语mythos同源,, ,直译过来的话一般被称为“寓言”。。。。。。这个名字正如新模子的定位,, ,一个“Mythos级”的模子,, ,一个“果真的神话”。。。。。。

凭证Anthropic的形貌,, ,Fable 5和Mythos 5共享统一个底层模子,, ,只是被装进了更适合果真分发的清静壳里。。。。。。在官方给出的模子能力上,, ,它们两个被放在统一个位置。。。。。。

但跑分归跑分,, ,若是Fable和Mythos的体现完全一样,, ,我想应该也不必分成两个名字了。。。。。。

被改写的“神话”

神话被改写、被压缩、被加上训诫之后,, ,酿成了寓言。。。。。。

凭证官方文档,, ,Fable 5是果真版本。。。。。。它面向通俗用户和开发者开放,, ,但在网络清静、生物、化学以及模子蒸馏等高风险领域,, ,会由特另外清静分类器介入。。。。。。一旦系统判断请求可能涉及这些敏感偏向,, ,回覆就不会由Fable 5继续完成,, ,而是自动回退到Claude Opus 4.8。。。。。。

Mythos 5基于同样的底层模子,, ,但在部分领域扫除了Fable 5的护栏。。。。。。Anthropic称,, ,Project Glasswing里的网络清静相助同伴可以使用“满血版”Mythos 5; ;;未来,, ,部学生命科学研究者也可能通过受信任会见妄想,, ,使用扫除生物和化学限制的版本。。。。。。

用不到的Mythos我们暂时不提,, ,先看点着实的工具。。。。。。

首先是定价,, ,一个字,, ,贵。。。。。。

Fable 5的定价是输入10美元/百万token,, ,输出50美元/百万token。。。。。。浚???⒄呦衷诰涂梢酝ü鼵laude API挪用claude-fable-5(模子名)。。。。。。

这个价钱恰恰是Opus 4.8的两倍,, ,和Opus 4.8的fast mode相同,, ,Anthropic显然把它放在了比Opus更高一档的价钱层级里。。。。。。

不过Anthropic称,, ,这一价钱不到此前Claude Mythos Preview的一半——但由于Mythos Preview并非果真API模子,, ,官方并未给出面向公众的标准价,, ,这句话也无从验证。。。。。。

订阅用户也需要注重,, ,Fable 5纷歧定会恒久直接包括在基础订阅包里。。。。。。

Anthropic在官方说明中提到,, ,6月23日以后,, ,纵然用户已经订阅Claude,, ,Fable 5也可能凭证算力情形按量提供,, ,纷歧定会直接包括在基础订阅服务中。。。。。。

这公司越来越小气了,, ,不过好歹还留了小半个月试用期。。。。。。官方也留了一点余地:若是6月23日以后算力资源足够,, ,Anthropic会只管把Fable 5继续包括在Pro、Max等订阅服务里。。。。。。

定价高自己并训斥以明确,, ,但它最好包管它的能力配得上它的价钱。。。。。。

从跑分上看,, ,Fable 5/Mythos 5基本是Anthropic现在果真内外最强的一档。。。。。。

不过官方表格有一个说明,, ,Claude Fable 5和Claude Mythos 5的分数一般只差1–3个百分点(除了带星号的网络清静、生物相关测试),, ,以是内外显示的是两者更高的分数。。。。。。这一点很难不让人想要吐槽。。。。。。

Anthropic把Fable 5的重点放在几个偏向:软件工程、知识事情、视觉、长上下文影象和生命科学研究。。。。。。

软件工程是最突出的场景之一,, ,凭证表格,, ,Fable/Mythos 5在SWE-Bench Pro上抵达80.3%,, ,显着高于Opus 4.8的69.2%; ;;在更难的FrontierCode Diamond上,, ,它拿到29.3%,, ,而Opus 4.8只有13.4%,, ,GPT-5.5只有5.7%。。。。。。

知识事情和视觉使命上,, ,Anthropic给出了两类证据。。。。。。

一类是标准化benchmark。。。。。。官方表格显示,, ,Fable/Mythos 5在GDPval-AA上得分1932,, ,高于Opus 4.8、GPT-5.5和Gemini 3.1 Pro; ;;在GDP.pdf这种带视觉明确的文档使命上,, ,它抵达29.8%,, ,也凌驾其他主要模子。。。。。。

另一类是早期客户测试。。。。。。Anthropic称,, ,Fable 5在Hebbia的高级金融推理基准上取得最高分,, ,优势集中在文档推理、图表和表格明确、问题求解; ;;IMC也反馈。。。。。, ,它在生意剖析评估中险些周全通过。。。。。。

为了展示Fable 5的视觉能力,, ,Anthropic举的例子是:此前Claude模子需要重大辅助工具才华玩《宝可梦 火红》,, ,而Fable 5只靠视觉输入就可以通关。。。。。。

长使命和影象能力上,, ,Anthropic称,, ,Fable 5可以在数百万token的恒久使命中坚持专注,, ,并使用自己的条记刷新输出。。。。。。

在《杀戮尖塔》这类需要一连决媾和恒久战略的游戏里,, ,若是给Fable 5接入长期文件影象,, ,让它能纪录前面的选择和履历,, ,它的体现会显着提升。。。。。。提升幅度是Opus 4.8的三倍,, ,抵达最终关卡的次数也提高了三倍。。。。。。

顺便一提,, ,Fable也是一款经典RPG游戏的名字,, ,中文译作《神鬼寓言》——或许某天我们能看到Fable玩《Fable》。。。。。。

另外,, ,网络清静能力方面,, ,Fable/Mythos 5在ExploitBench Cap%上抵达78.0%,, ,凌驾Claude Mythos Preview的69.0%,, ,靠近Opus 4.8的两倍。。。。。。

这里用的应该是Mythos 5的得分,, ,由于Fable 5在高风险请求上会回退到Opus 4.8。。。。。。

强盛的模子必需分层

Anthropic这次把模子能力的直观展示放到了一个类似”作品集“的滑页里,, ,并且每个demo只给了一小段注释。。。。。。

好比,, ,Fable 5写了一个太阳系模拟,, ,从物理第一性原理推导行星轨道运动,, ,并用它展望日食。。。。。。

又好比,, ,它可以自主玩《异星工厂》。。。。。。这是一款工程师很爱的工厂自动化游戏,, ,玩家要收罗资源、妄想生产线、搭建物流和能源系统。。。。。。

Anthropic用这个例子说明,, ,Fable 5可以在一个开放情形里制订战略,, ,并一连推进一个重大系统的建设。。。。。。

在另一个demo里,, ,Fable 5先做了一个基于浏览器的CAD编辑器,, ,然后又使用这个由自己开发的CAD工具,, ,设计了一个可以3D打印的完整模子。。。。。。这个编辑器里还内置了AI copilot,, ,用来辅助建模。。。。。。

这个demo的重点在于Fable 5完成了一个闭环:先创立工具,, ,再使用工具,, ,最后完成一个实体设计使命。。。。。。

最后一个demo,, ,Anthropic展示了一个由Fable 5写出来的流体模拟,, ,运动节奏和一段古典音乐EDM remix同步。。。。。。官方还特意提到,, ,音乐也是Fable 5用代码天生的。。。。。。

这些案例看起来挺花哨,, ,但意思是一样的:Fable 5很善于把代码、视觉、物理、设计和恒久妄想混在一起做使命。。。。。。

若是说这部分展示的照旧Fable 5在开发者手里能做到什么水平,, ,后面的部分说的就是Mythos 5在研究者手里能做什么——以及Anthropic为什么要把Fable和Mythos脱离。。。。。。

Anthropic称,, ,在内部卵白设计专家的评估中,, ,Mythos 5把药物设计流程中的部分环节加速了约莫10倍。。。。。。其中一个案例里,, ,Mythos 5接入卵白设计和生物信息学工具、没有人类资助,, ,就可以匹配甚至凌驾熟练人类操作员。。。。。。

在该使命中,, ,Mythos 5做的不是简朴问答,, ,而是完成一整套科学事情流:选择连系位点,, ,选择并运行卵白设计工具,, ,在失败后自己恢复。。。。。。官方称,, ,在这项研究的14个卵白靶点中,, ,有9个爆发了强候选分子,, ,现在正在进一步研究。。。。。。

Anthropic还提到,, ,Mythos 5可以稳固提出新颖、有吸引力的分子生物学假设。。。。。。在和Opus级模子的盲测比照中,, ,内部科学家约莫80%的时间更偏好Mythos提出的假设,, ,其中一些已经进入实验评估。。。。。。

与此同时,, ,Mythos 5的一个关于大肠杆菌卵白的新机制的假设,, ,在另一家自力研究统一问题的实验室的研究中获得了证实。。。。。。

它甚至还做了一项基因组学研究。。。。。。

Anthropic称,, ,Mythos 5在一周多的时间里,, ,险些自主完成了一项新的基因组学研究。。。。。。它整理了横跨138种动物、数百万个细胞的单细胞数据,, ,并设计、训练了一个定制机械学习模子,, ,用来识别差别物种中执行相同角色的细胞。。。。。。

更夸张的是,, ,Anthropic称,, ,Mythos 5训练出的模子性能凌驾了近期揭晓在《Science》上的一个模子,, ,只管它的规模只有后者的百分之一。。。。。。Anthropic体现,, ,妄想在未来几个月揭晓这些效果。。。。。。

虽然,, ,这部分还需要期待论文和外部复核。。。。。。但若是只看Anthropic官方给出的信息,, ,Mythos 5在生命科学里展示的能力已经靠近科研Agent:能读问题、用工具、处理数据、训练模子、提出假设,, ,并把一项研究推进到可以揭晓的水平。。。。。。

而一旦模子可以在药物设计、病毒载体、卵白设计、基因组学研究这些偏向里真正推进使命,, ,它就自然具备双重用途。。。。。。

可以以为,, ,生命科学这部分不是Fable 5的通俗功效演示,, ,而是Mythos 5的能力上限展示。。。。。。

但它被展示出来,, ,是为了说明Anthropic手里的这套底层模子,, ,已经强到了必需通过受信任会见来分发。。。。。。

有意思的是,, ,已往的模子宣布更像是一件手艺产品的事:参数、跑分、价钱、上下文长度、API名称。。。。。。强就是强,, ,宣布就是宣布。。。。。。

但到了Mythos这里,, ,事情最先变得重大。。。。。。统一个底层模子被分为两个版本,, ,通俗用户拿到的是Fable 5,, ,清静研究者和部学生命科学研究者拿到的是Mythos 5; ;;前者被装进更严酷的护栏里,, ,后者则需要受信任会见。。。。。。

模子能力不再只有崎岖之分,, ,也最先有权限、场景和责任之分。。。。。。

某种意义上来讲,, ,可以看作前沿模子商业化进入新阶段的信号——越强的模子,, ,越不可能直接扔给所有人。。。。。。它们会被拆成差别版本,, ,放进差别清静界线,, ,再交给差别类型的用户。。。。。。

Anthropic先这么做了,, ,由于它们的模子“强到不可完全果真”。。。。。。未来其它想要讲故事的公司,, ,想要证实自己的模子也很强,, ,或许也会效仿这种方式。。。。。。(作者/袁心玥)

75年沧桑巨变,, ,西藏早已不但是游客心中的“诗和远方”,, ,在中国战略国界上,, ,它的分量正变得越来越重。。。。。。

责任编辑:刘玮恭

【网站地图】