黄仁南宫28官网- 南宫28官方网站- APP下载勋说‘Scaling Law被低估100倍’AI推理的token战争会压垮中小企业吗?

2026-03-18

  南宫28官网,南宫28官方网站,南宫28APP下载

黄仁南宫28官网- 南宫28官方网站- 南宫28APP下载勋说‘Scaling Law被低估100倍’AI推理的token战争会压垮中小企业吗?

  黄仁勋提出“scaling law被低估100倍”,核心是强调AI推理需求爆发远超预期,但中小企业可通过开源生态、成本下降趋势及新型商业模式缓解压力,而非必然被“token战争”压垮。

  黄仁勋认为,当前算力需求呈“双重指数级增长”,尤其是AI推理环节的token消耗量远超预期。他提出三大规模法则:预训练、强化学习(后训练)和推理,其中推理是AI落地的核心场景,其消耗的token量可能达训练阶段的1000倍以上(例如智能体生成代码需数万token/次)。

  原因:智能体(Agent)的普及(如OpenClaw三周下载量超Linux三十年)推动实时交互需求激增,企业为生成token需持续投入算力。

  单价暴跌:截至2025年底,百万token价格低至0.028美元(≈0.2元人民币),阿里、腾讯等云服务商已实现“1元购百万token”。

  总量激增:因单价下降刺激使用量,企业AI月度支出仍增长36%(IDC数据),形成“效率提升→用量暴增→总成本未降”的杰文斯悖论。

  DeepSeek-R1等开源推理模型出现,中小企业无需自研大模型,通过微调即可适配垂直场景,大幅节省训练成本。

  黄仁勋强调:开源模型(如DeepSeek-R1)推动“技术平权”,让AI从“高技能”变为“水电煤”式基础设施。

  架构创新:类似DeepSeek-R1的模型通过优化推理架构,单token计算量降低50%,响应速度提升5倍。

  边缘计算:本地化部署降低云端依赖,例如自动驾驶、工业机器人通过边缘设备处理实时决策。

  算力租赁模式(如鸿博股份、首都在线)允许中小企业按token消耗量付费,避免重资产投入。

  云厂商推出“缓存命中优惠”,对高频重复查询大幅降价(如阿里云输入缓存0.028美元/百万token)。

  传统IT运维向“AI运维”转变,需掌握提示词工程、模型微调等技能,否则效率红利无法释放。

  高风险行业(如法律、医疗)因AI幻觉可能承担更高纠错成本(参考律师用ChatGPT伪造案例被罚事件)。

  这意味着拥有高效推理能力的企业可将token转化为服务溢价(如智能客服替代人工)。

  黄仁勋提出“AI五层架构”:能源层(电力)是底层约束,芯片层(算力)是核心,应用层(智能体)创造价值。

  中小企业需关注“电算协同”(如绿电+数据中心),降低单位token能耗成本。

  短期:拥抱开源模型+算力租赁,优先在容错率高的场景试水(如营销文案、基础客服)。

  长期:培养复合型人才(行业知识+AI工具使用),布局边缘计算与能源优化。

  本质:token战争非零和博弈,而是推动企业从“人力密集型”转向“智能密集型”——一如黄仁勋所言:

地址:广东省广州市天河区88号 客服热线:400-123-4567 传真:+86-123-4567 QQ:1234567890

Copyright © 2012-2025 南宫28官网- NG南宫下载链接- 南宫28APP下载 版权所有 非商用版本