|
广告联系
|
繁体版
|
手机版
|
微信
|
微博
| 搜索:
欢迎您
游客
|
登录
|
免费注册
|
忘记了密码
|
社交账号注册或登录
首页
温哥华资讯
温哥华地产
温哥华教育
温哥华财税
新移民/招聘
黄页/二手
旅游
故事
|
移民
|
留学
|
八卦
|
娱乐
|
投资
|
旅游
就业
|
健康
|
文艺
|
情感
|
科技
|
华人
|
海归
温西
|
西温
|
本那比
|
列治文
|
白石
|
市中心
温东
|
北温
|
高贵林
|
北素里
|
素里
|
满地宝
大温
|
玩乐
|
吃喝
|
社团
|
汽车
|
贴图
生活
|
房屋
|
亲子
|
摄影
|
原创
|
投资
专栏
|
视频
群组
|
图库
生活资讯
专栏
科技信息
记忆体杀手?新技术让多头丢盔弃甲
请用微信
扫一扫
扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击
发送给朋友
或
分享到朋友圈
,谢谢!
2026-04-06
| 来源: 自由财经 |
转到微信
|
有0人参与评论
| 字体:
放大
缩小
|
收藏
|
打印
科技大厂Google日前发表最新AI压缩技术TurboQuant,这项可以将AI模型中在推论过程中所需的记忆体大幅减少,这一消息传出后震撼了业界,也让市场开始质疑记忆体芯片的荣景是否能够延续。
TurboQuant是一种旨在解决“键值快取(Key-Value Cache)”瓶颈问题的演算法,Google将键值快取描述为“数位作弊表”,他实际上充当了AI模型的短期记忆。每当大型语言模型处理一段对话时,都会将过去的计算结果储存在这个快取中,这样就无需从头开始计算。
随着对话愈长,这份表就愈大,占用GPU(图型处理器)记忆体的速度就愈快。虽然可以透过压缩资讯来增加这张“作弊表”的容量,但他仍会很快被填满,然而,压缩可能会导致模型出现“幻觉”或是出错。
TurboQuant旨在解决其中的一些问题,Google研究人员表示,TurboQuant将AI模型中的键值记忆体大小减少了至少6倍,并将速度提高了8倍,且不影响模型准确性。
市场听说AI相关的记忆体使用量减少了6倍,这可能会让那些从记忆体类股热潮中获利的
投资
人感到担忧,因为这些公司的涨势是建立在AI对记忆体处理器和储存容量不断成长的需求之上。
Evercore分析师达里亚纳尼(Amit Daryanani)指出,Google推出的TurboQuant为大幅降低AI工作负载的记忆体提供了一条途径。如果TurboQuant能够获得显著发展,可能会对DRAM(动态随机存取记忆体)和NAND(储存型快闪记忆体)等记忆体的长期需求预期构成压力。
美光单周市值蒸发700亿美元
受到Google最新技术的打击,
美国
记忆体芯片股单周市值蒸发近1000亿美元。
其中以
美国
记忆体大厂美光科技表现最惨烈,单周市值蒸发超过700亿美元,跌幅达15%。去年,标普500指数当中表现最好的快闪记忆体制造商晟碟(SanDisk)单周市值蒸发约150亿美元;记忆体公司威腾电子(Western Digital)和希捷(Seagate)市值也分别蒸发了数十亿美元。
加州资产管理公司Informed Momentum Company
投资
长普伦帝斯(Travis Prentice)表示,这些股票已经经历了巨大的上涨,因此任何微小的消息都可能导致股价下跌,这是合乎逻辑的情况。
普伦帝斯补充,记忆体类股的上涨行情看起来还没有结束,但市场预期很高,因此获利了结是明智之举,尤其是在当前动荡的市场环境下。
效能更强的AI模型需用更多记忆体
专家表示,虽然TurboQuant技术可以减少记忆体使用量,但对记忆体需求减缓的担忧有些过头了。普遍观点认为,尽管Google宣布记忆体使用量可能减少,但这将推动AI技术的进步和普及。因此,TurboQuant技术出现实际上代表芯片需求增加,而不是减少。
微软储存新技术 资料可保存上万年
如何使用新技术绕过威权主义的监控?
美科学家研发稀土提取新技术 产量可倍增
一些分析人士指出,提高资源利用率往往会导致资源消耗增加,因为效率提升会开启以前不存在的用途。
摩根大通(JPMorgan)报告就提到了这一论点,报告中认为,记忆体消耗短期内不会受到威胁。 SemiAnalysis分析师也提到,解决瓶颈问题可以提升AI硬体的效能,而效能更强的模型最终需要的是更多的记忆体,而不是更少记忆体。
摩根士丹利(Morgan Stanley)分析师在报告中写道,TurboQuant等效率提升技术可以减少运行AI模型所需的基础设施。如果模型能够在不损失性能的前提下,大幅降低记忆体需求,那么每次查询的服务成本将明显下降,进而提升AI的盈利能力。原本需要云端丛集的模型现在可以部署在当地的硬体上,有效降低了大规模部署AI的门槛。
Sandisk财务长威索索(Luis Visoso)在与美银证券(BofA Securities)分析师的对话中也谈到这一议题。威索索指出,TurboQuant可以提升超大规模资本支出的
投资
报酬率,而这种效率的提升,反过来又可能推动需求上升。
(彭博社资料照片)
TurboQuant的效率提升真正威胁是NAND快闪记忆体
分析师也很快意识到,并非所有记忆体市场领域都同样感到恐慌,TurboQuant的效率提升仅限于推论和键值快取,这代表真正的威胁来自NAND快闪记忆体,而非高频宽记忆体(HBM)。
HBM是辉达AI加速器的核心零件,也为微软(
Microsoft
)、Meta等公司的训练基础设施提供动力。彭博产业研究分析师希尔佛曼(Jake Silverman)撰文指出,由于需要将模型权重储存在GPU记忆体中,HBM的需求以及美光生产的DRAM需求可能不会受到影响,NAND的需求将面临更深远的长期影响。
大摩分析师表示,TurboQuant透过减少记忆体使用和数据传出,明显提升了推论效率,但他并没有降低对HBM等核心记忆体的需求。
韩媒也认为,该国两大记忆体厂商
三星
电子Samsung Electronics)和SK海力士(SK Hynix)预计将受惠于TurboQuant技术商业化。
三星
证券研究员表示,如果采用TurboQuant演算法,可以降低推论成本,需求将爆炸性成长。
您的点赞是对我们的鼓励
无评论不新闻,发表一下您的意见吧
分享:
注:
新闻来源于其它媒体,内容不代表本站立场!
猜您喜欢:
利用新技术和培训支持卑诗省粮食安全
如何使用新技术绕过威权主义的监控?
美科学家研发稀土提取新技术 产量可倍增
微软储存新技术 资料可保存上万年
大温著名发廊 美发师都来自于日本
温哥华资深贷款专家 解决贷款需求
骑这种车还飙车 大温14岁少年被捕
省钱啦 BC联邦项目节省高达1700元
列治文出大事!船只沉没致六人失踪
曝央视主持人董卿母亲去世!患癌七年....
他是陈冲前夫,定居好莱坞近40年,现状曝光
传北京飞机撞楼前夕 首都机场发紧急通知
宛如大片!美国这监狱暴动已被平息
演员汤唯:16岁初恋,三次高考,被封杀远走英国,35岁嫁韩国导演
可怕!加国男子以为流感几周后死亡
现偶2026多部剧将播:越禁忌越上头
您可能也喜欢:
郭斌:6岁被伯母挖掉双眼 今高考分数721
这国首都被夷为平地 死亡人数恐突破1万
温哥华汇款/外币兑换 汇率最优安全
加国拒批了过半的世界杯访客申请
马斯克、小扎子女都学这语言 富豪动机更强
川普女发言人晒自拍 产后不到俩月开始工作
杀疯了!《昨夜将至》刚播豆瓣好评如潮,大尺度案件全程无尿点
同一日,两家中国上市公司发公告:董事长被刑拘
谄媚遭批!吕特访白宫造新词"特万亿"
为39天看完104场世界杯比赛 俩小伙辞职又分手…
温哥华牙医 采用先进技术最新设备
总理官邸修复将进行涉及竞赛&众筹
3战被轰10球 亚洲冠军成"鱼腩"垫底出局
学区房大地震!三把刀,同时砍下来
加国队被足联僵化的赛程安排坑惨
Apple即日加价 MacBook贵15% Mac mini加4成
我来说两句:
评论:
安全校验码:
请在此处输入图片中的数字
大家正在围观
创造历史!加拿大战胜南非晋级16强
又涨价!大温公交票价本周全面上涨
加拿大急诊室长时间等待真正原因
刘国梁双胞胎女儿: 老大被藤校争
加拿大卡车司机违规撞死华人妈妈
气愤 电动滑板在温市行人道撞伤人
泳池'肉体激战'恐怖画面曝!比基尼
遗忘的彩票 加国女子中奖提前退休
数千加国球迷涌洛杉矶 为球队加油
淘汰赛今日开始 加拿大对阵南非
同类热门新闻
马斯克、小扎子女都学这语言 富豪
马斯克贝索斯和扎克伯格子女都在
苹果涨价,美光开撕 我们终于要交A
美光高管吐槽苹果涨价:芯片涨45美
苹果涨价最新:MacBook贵15% Mac m
谷歌前CEO忧心 中国AI全面开源 不
苹果加价之际,科技与电玩企业纷纷
前Google执行长警告:中国AI技术仅
互联网既在消失,又在永生:删不干
进军光通信!马斯克也要站在"光"里
随时阅读新闻
加西网微信
大温优惠小红书
温哥华地产中心微信
Android: 加西网
Terms & Conditions
Privacy Policy
Political ADs
Activities Agreement
Contact Us
Sitemap
加西网为
北美中文网
传媒集团旗下网站
页面生成: 0.0329 秒 and 4 DB Queries in 0.0021 秒