| 广告联系 | 繁体版 | 手机版 | 微信 | 微博 | 搜索:
欢迎您 游客 | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

首页

温哥华资讯

温哥华地产

温哥华教育

温哥华财税

新移民/招聘

黄页/二手

旅游

120万亿Token!中国AI正在"卷"死美国


请用微信 扫一扫 扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击 发送给朋友分享到朋友圈,谢谢!
一次企业级任务,动辄几十万甚至上百万Token。


中信证券测算,智能体执行任务时整体Token消耗可能提升十倍以上,对应的算力需求得涨百倍以上。这种“推理密度”的增加,让单次任务的Token消耗呈指数级上升。

在OpenRouter平台上,超过70%的Token消耗来自网络大厂、中大型企业、专业程序员的生产环境。在100K到1MToken这个区间(智能体工作流最典型的消耗区间),中国模型的调用量遥遥领先。


应用爆发→Token增长→模型优化→更多应用。这个正向商业落地循环,真的已经转起来了。

02

很多人问:中国大模型商业化能如此迅猛,凭什么?

答案很简单:成本,低到令人发指的成本!大模型运营成本里,60%-80%是电费。中国西部(甘肃、内蒙古、贵州)绿电价格只要0.13-0.3元/度。在美国呢?0.8-1.2元/度。

光电力一项,中国就比美国便宜4-5倍。

如果假设一个大型推理集群年用电量为100GWh,仅电力一项,中国的年成本约1150万美元,美国约1540万美元——差出近400万美元。

再加上MoE架构、极致量化、KV缓存……推理效率再比美国高3-10倍,双重降维打击下,中国模型的推理成本被压缩至美国模型的1/6至1/10。

最终体现在API定价上(美元/百万Token):

-MiniMaxM2.5:输入0.3、输出1.1;

-智谱GLM-5:输入0.3、输出2.55;

-通义Qwen3.5:输入0.11、输出0.44;


-对比ClaudeOpus4.6:输入5、输出25;

这意味着,中国模型成本只有美国巨头的1/10到1/20,甚至更低。



形同天堑一样的差距。


而性能呢?在文本生成、代码、翻译、日常推理等90%的高频场景,中国头部模型已经达到GPT-5、Gemini3的95%以上。

对绝大多数用户来说,“够用、好用、便宜”就是全部。中国模型完美踩中了这个点。

于是,全球开发者用脚投票:OpenRouter平台数据显示,47.17%的用户是美国本土开发者,中国开发者仅占6.01%,但中国大模型在该平台的周Token调用量占比已达61%,连续三周超越美国

更震撼的是调用量排名:在全球前九大模型中,中国占据五席,小米MiMo-V2-Pro、阶跃星辰Step3.5Flash、MiniMaxM2.5、DeepSeekV3.2包揽前四,智谱GLM-5Turbo位列第六。

这样的大模型,超级便宜又足够能打,海外市场想要“脱钩”?不存在的。“成本刚需”已经碾碎了所有壁垒。

不过,另一方面,中国Token的超级红利,却是OpenAI、Google、xAI的压力挑战。

来看几个硬核数据:

OpenAI:ChatGPT在生成式AI网页流量中的份额从2025年1月的86.7%暴跌至2026年1月的64.5%,一年跌了22.2个百分点。2月全球月活用户约5.35亿,按月下降6.5%。运营亏损预计将达到140亿美元,几乎是前一年的三倍。更讽刺的是,80%的用户全年交互不足1000次——打开率还不如外卖软件。

Google:尽管Gemini的份额从5.7%涨到了21.5%,但AIStudio开发者流失25%,被迫推出低价版GeminiFlash(3美元/百万Token),但成本仍是中国模型的3倍。
1     还没人说话啊,我想来说几句
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
    猜您喜欢:
    您可能也喜欢:
    我来说两句:
    评论:
    安全校验码:
    请在此处输入图片中的数字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西网为北美中文网传媒集团旗下网站

    页面生成: 0.0285 秒 and 5 DB Queries in 0.0023 秒