凯时AG

离别“重算力、轻效益”误区:光合组织“Token谱系”求解算力投入产出失衡

作者:李旺劭
宣布时间:2026-06-14 13:43:10
阅读量:356

离别“重算力、轻效益”误区:光合组织“Token谱系”求解算力投入产出失衡

泉源:环球网

前言:1986年,,,国家“863妄想”启动,,,中国信息手艺自主立异的征程由此滥觞。。。。。四十年已往,,,国产算力从无到有、从追赶到并跑,,,走过了引进消化、自主研制、生态构建的漫长蹊径。。。。。早期,,,“缺芯少魂”的逆境曾让一代科研事情者负重前行;;;;;;现在,,,国产CPU、GPU、AI芯片已在数据中心、超等盘算、要害行业落地生根,,,“可用”问题起源解决。。。。。

然而,,,当大模子与智能体掀起AI工业化浪潮,,,一个新的命题浮出水面:算力有了,,,但算力的“效益”怎样释放 ???企业投入巨额资金采购算力,,,却经常陷入“Token焦虑”——适配本钱高、调理效率低、数据风险大,,,投入与产出失衡。。。。。行业亟需从“重硬件、轻协同”的旧模式中突围。。。。。

本次《863妄想40年》系列采访,,,我们将关注国产算力怎样追求算力投入产出的解决方案。。。。。

【环球网科技报道 记者 李文瑶】5月28日,,,2026天下智能工业博览会(智博会)在天津开幕。。。。。当大模子与行业智能体从“炫技”走向规;;;;;;涞,,,工业界的焦虑点也已转移:从“算力够不敷大”,,,转向了“算力效益够不敷高”。。。。。Token——这一承载AI交互与推理的基本单位,,,成为了权衡算力价值的新标尺。。。。。

然而,,,算力架构的碎片化、生态的关闭割裂,,,导致Token生产不稳固、调理受阻、投入产出比失衡,,,成为困扰企业的普遍痛点。。。。。在本届智博会上,,,光合组织携其“开放盘算Token谱系”亮相,,,联合超6000家生态同伴回覆一个焦点命题:怎样解放Token生产力,,,让每一分算力投入都能转化为可见的工业价值 ???

直击痛点:从“算力焦虑”到“Token效益”的认知升维

走进天津国家会展中心N26-01展位,,,光合生态同伴的联合展示区前人头攒动。。。。。与往年纯粹比拼芯片峰值算力差别,,,今年展区的要害词酿成了“效率”与“产出”。。。。。

“已往各人问‘你的芯片算力是几多T’,,,现在问‘跑一个Token的本钱是几多 ???延迟有多低 ???”展台事情职员向记者先容。。。。。这种提问方式的转变,,,折射出行业认知的根天性转变。。。。。

在采访中,,,海光信息总裁助理兼智能盘算产品部总司理杜夏威直言不讳地指出,,,行业正陷入一种“Token焦虑”。。。。。他诠释道:“Token焦虑未必是坏事情。。。。。若是你对Token没有感知,,,自然不会焦虑;;;;;;现在各人都在焦虑,,,恰恰说明工业在快速流动。。。。。”他以为,,,这种焦虑具有双重性:一方面,,,企业担心国产算力能否承接爆发式增添的需求;;;;;;另一方面,,,更焦虑于怎样将Token与自己原有的生产型营业深度融合,,,阻止算力资源的闲置与铺张。。。。。

海光信息总裁助理,,,立异产品线总司理李成则从手艺演进角度增补了一个要害趋势:“已往训练阶段以GPU为主,,,CPU的作用被低估。。。。。但随着Open Claw等智能体的生长,,,我们发明CPU的处理时间可能占到整个Agent使命处理时间的90%。。。。。”他引述行业研究称,,,在AI推理与智能体交互中,,,CPU与GPU的比例正从已往的1:4向1:1甚至更高过渡。。。。。“GPU认真跑得快,,,CPU认真跑得稳、跑得久。。。。。智能体不是一问一答,,,而是长时间、多使命、随机交互的系统工程,,,这恰恰是通用CPU的强项。。。。。”

这一判断直接挑战了“唯GPU论”的行业惯性。。。。。杜夏威进一步强调:“算力指标是芯片物理能力的‘天花板’,,,我们依然要回归客观维度。。。。。但围绕算力指标之上,,,更要看怎样快捷、高效地将算力转化成Token。。。。。算力指标权衡的是芯片自身能力,,,而Token吞吐力权衡的是把算力营业化的能力。。。。。”

这诠释了为何光合组织在本届智博会上的焦点行动是宣布“开放盘算Token谱系”。。。。。该谱系并非简单手艺,,,而是一套从硬件、软件到应用的三层协同架构,,,旨在解决算力工业恒久保存的三大焦点问题:算力标准统一、调理互通与应用赋能。。。。。

生态破局:三层协同解构“Token谱系”价值逻辑

在古板模式下,,,算力供应犹如“九龙治水”——芯片指令集各异、开发情形不兼容、集群调理效率低下。。。。。企业往往采购了腾贵的服务器,,,却因适配周期长、跨平台迁徙难,,,导致大宗算力在“客栈”和“机房”中甜睡。。。。。

光合组织的“Token谱系”试图通过全链协同重构这一逻辑。。。。。

首先是在硬件筑基曾,,,统一算力标准。。。。。谱系的底座是国产芯片。。。。。李成向记者阐释了海光的云边端全场景结构逻辑:“凯时AG焦点逻辑是高清静、高通用、高性能。。。。。从云端的海光CPU高焦点数、高负载能力,,,到边端的轻量服务器、嵌入式低功耗产品,,,再到终端的AIPC与智能体专用芯片——CPU、GPU、NPU三位一体,,,客户可以即开即用,,,无需重复适配。。。。。”

其中,,,面向工控和边端场景的嵌入式芯片尤其值得关注。。。。。光合组织嵌入式产品专家张考华在采访中强调:“海光推出的C86架构嵌入式芯片并非‘降级品’,,,而是将高端服务器芯片的手艺下移,,,并针对宽温、卑劣情形、内生清静等工业特征做了专门设计。。。。。”他提到,,,已往国产芯片常被贴上“能用但欠好用”的标签,,,但这更多是一种头脑惯性。。。。。“这款芯片已经在海内多个案例中获得用户正向反馈,,,从市场磨练来看,,,我们很是有信心。。。。。”

第二个层面是软件提效,,,实现调理互通。。。。。仅仅有芯片是不敷的。。。。。在光合展区,,,记者看到了基于自研HSL开放总线协议的异构互联架构。。。。。这一架构允许差别厂商的算力芯片在系统层面高效协同,,,而非简朴堆砌。。。。。

针对记者提出的“万卡集群中怎样解决堆得越多消耗越大”的问题,,,李成给出了明确的谜底:“除了CPU和DCU的双芯支持外,,,我们还提供类似NVLink/NVSwitch的互联芯片,,,别的,,,海光在互联互通协议上做了大宗事情。。。。。从小集群到超节点网络,,,我们能支持凌驾万卡集群的AI互联系统,,,包括RDMA、一级/二级叶脊架构的高效协同。。。。。这是我们有别于其他竞争厂商的一个较量大的优势。。。。。”

杜夏威则从调理角度增补:“有些算力实时性要求高,,,不适合都往云端传;;;;;;有些则需要举行大规模训练。。。。。通过开放调理架构和统一的算力标准,,,我们可以实现Token的分级引流——就近的边沿侧盘算与集中的数据中心盘算形成协同,,,极大镌汰数据传输压力与资源闲置。。。。。”

最后即是应用层面的增值,,,聚焦产值转化。。。。。这是“Token谱系”的最终落脚点。。。。。展区现场,,,23大领域的落地效果被集中展示:从质料盘算、生物医药到气象仿真、智能制造,,,300余项重点应用已完成深度适配。。。。。

“Token能不可被用户的营业侧真正使用起来,,,是凯时AG新权衡指标。。。。。”杜夏威在访谈中重复强调这一看法。。。。。他分享了一个视角的视察:“已往各人关注模子训练的效率,,,但未来,,,模子效率并不可完全等价于Token效率。。。。。即便转化成了Token,,,在营业中仍有大宗优化空间,,,我们要协助用户完成场景转化,,,而不是仅仅让模子跑起来。。。。。”

生态协同如作甚“应用层”解渴 ???

理论的弘大叙事,,,最终要落到详细工程师的键盘声和产线的数据流中。。。。。在智博会现场,,,记者采访了多位光合组织的生态同伴,,,听到了几个关于“Token提质增效”的真实故事。。。。。

麒麟信安副总司理孙玉峰向记者分享了一组直观的数字转变。。。。。“以前麒麟信安做方案适配,,,光调试就要2到3周。。。。。”孙玉峰坦言,,,在古板的算力供应模式下,,,芯片、操作系统、中心调理、应用之间各自为政,,,每接入一个新场景,,,都像一次“拼图游戏”,,,大宗时间泯灭在底层兼容性验证上。。。。。

转变始于光合组织“开放盘算Token谱系”的落地。。。。。孙玉峰先容,,,该谱系将中心调理、操作系统、项目应用拉通到一条流水线上,,,“我们现在从芯片到营业上线,,,压缩到1周以内。。。。。Token从爆发到交付的时间少了,,,效益自然就出来了。。。。。”

他用三个词概括光合生态的协同感:无感、高效、增值。。。。。“真正的协同感,,,自己就是要各人无感。。。。。”孙玉峰诠释道,,,麒麟信清静面兼容海光的国产CPU,,,并基于海内终端构建全栈、全链设计,,,“从上层应用基本感知不到切换,,,这才是底层生态成熟的标记。。。。。”

高效则是极致协同下的必定效果。。。。。“当软硬件全栈拧成一股绳,,,跨平台调理消耗会显著下降。。。。。”这种高效不但体现在项目周期上,,,更直接反映在算力资源的使用率上。。。。。

而“增值”在单位算力上体现得尤为显着。。。。。孙玉峰体现:“凭证营业场景分配,,,统一个Token在光合谱系中的营业价值更高。。。。。这也决议了许多AI用户的选择站位——他们不再只看单点性能,,,而是看整个生态能带来的产出。。。。。”

云宏信息华北区总司理葛玉龙用一个形象的比喻,,,诠释了光合生态怎样解决算力碎片化难题。。。。。“我们做虚拟化,,,实质上是差别芯片之间的‘调理翻译官’。。。。。”葛玉龙说,,,“若是底层芯片保存手艺壁垒,,,从A芯片到B芯片,,,Token消耗可能掉到30%。。。。。”这种消耗意味着企业每花1元钱买算力,,,只有7毛钱真正爆发了营业价值。。。。。

光合组织的开放盘算Token谱系,,,则通过买通多芯调理的底层,,,让虚拟化平台可以在差别芯片之间无缝切换。。。。。“不设卡、不落伍、有议价”——葛玉龙用三个要害词形貌这种协同感。。。。。

谈及Token效益,,,葛玉龙的看法与孙玉峰不谋而合。。。。。他指出:“已往各人提算力规模,,,但Token的效益并没有随着算力线性增添。。。。。国产算力生态的焦点价值不是群集硬件,,,而是做效率的乘法。。。。。就像光合组织用开放、协同的方式,,,把国产软硬件全栈拉通成一个谱系,,,让每一个Token从生产到变现路径更短、消耗更小、价值更高。。。。。这是Token效益提升须要的一环。。。。。”

在采访历程中,,,一个看法被重复提及:不可由于Token热,,,就完全否认基础算力指标的主要性。。。。。这意味着,,,工业界正在走出“重算力、轻效益”的误区。。。。。纯粹的峰值算力堆砌,,,若是不可转化为营业侧流通的对话体验或精准的推理效果,,,那么关于企业来说就是负资产。。。。。光合组织提出的“开放盘算Token谱系”,,,实质上是一套价值分配与转化机制。。。。。它试图通过硬件、软件、应用的深度联动,,,让算力提供方不再只卖盒子,,,而是加入价值分成;;;;;;让应用方不再盲目采购,,,而是按Token效能付费。。。。。

从“可用”到“高效”,,,算力基建进入下半场

智博会时代,,,光合组织与众智FlagOS、中科曙光、智源研究院、天津大学、中国移动天津公司等十余家产学研单位签约,,,共建“算力芯片+大模子+工业生态”全链立异平台。。。。。同时,,,天津市算电协同工业同盟建设,,,最先从能源侧解决算力本钱的深层问题。。。。。

这些行动释放出明确信号:国产算力基建正从早期的“解决有无”、“买通断点”,,,迈向“极致优化”、“效益优先”的新阶段。。。。。

“我们只是其中的一分子。。。。。”杜夏威在采访中谦逊地体现。。。。。但他同时强调,,,市场的活跃与利润的增添是工业成熟的必定历程。。。。。“快速增添意味着市场在活跃,,,Token与工业的集成尚有许多事情要做,,,但这正是凯时AG时机。。。。。”

李成则给出了一个总结:“海光CPU在算力底座中肩负三个地基作用——承接生态、提供高速互联协议、包管内生清静。。。。;;;;;;〔焕,,,地动山摇。。。。。这是未来AI生长的最大基础,,,也是我们生长的底气所在。。。。。”

据相识,,,以开放盘算Token谱系为焦点,,,光合组织正一连拓睁开放生态界线、深化工业协同,,,系统性破解Token焦虑,,,推动国产算力迈向更高质量、更高效能的新阶段。。。。。

 

文章点评

未盘问到任何数据!

揭晓谈论

◎接待加入讨论,,,请在这里揭晓您的看法、交流您的看法。。。。。

最新文章

热门文章

随机推荐

【网站地图】