-
日期: 2025-05-16 | 来源: 中时新闻网 | 有0人参与评论 | 字体: 小 中 大
据《快科技》报道,腾讯混元图像2.0相比前代模型,其参数量提升了一个数量级,得益于超高压缩倍率的图像转码器以及全新扩散架构,其生图速度显著快于行业领先模型。
报道指出,在同类商业产品每张图推理速度需要5到10秒的情况下,腾讯混元可实现“毫秒级”回应,支持用户可以一边打字或者一边说话一边出图,改变了传统“抽卡—等待—抽卡”的方式。
除了速度快以外,腾讯混元图像2.0模型图像生成品质提升明显,通过强化学习等演算法以及引入大量人类美学知识对齐,生成的图像可有效避免AIGC图像中的“AI味”,真实感强、细节丰富、可用性高。
在图像生成领域专门测试模型复杂文本指令理解与生成能力的评估基准GenEval(Geneval Bench)上,腾讯混元图像2.0模型准确率超过95%,远超其他同类模型。
腾讯表示,腾讯混元图像2.0引入多模态大语言模型(MLLM)作为文本编码器,配合自研的结构化caption系统,不仅能理解你在说什么,更能推测出你希望画面“怎么表达”。哪怕你一句话里埋了三层含义,它也能一一拆解,再一笔一笔划出来。
报道说,除了文字输入,腾讯混元图像2.0还可以通过语音直接输入提示词,系统将语音自动转写为文字,并在识别后即时生成图像,适用于直播讲解、移动创作等场景。
也可以上传草图作为参考,模型能自动识别线稿的结构与构图逻辑,再结合提示词内容补全光影、材质、背景等细节,迅速扩展成图。
提示词:“人像摄影,爱因斯坦,背景是东方明珠,自拍视角”在混元图像2.0生成的超写实画质AI图片。(图/腾讯混元AI)- 新闻来源于其它媒体,内容不代表本站立场!
- 兰里地产专家 多年兰里地产经验
- 可怕!大温等待救护车时间越来越久
-
- 大温华裔车祸惨死 嫌犯就这样没事了
- 爱奇艺、腾讯、优酷甩出"巅峰剧"火力全开,谁能登顶独占鳌头?
- 吴彦祖上海街头街拍,被女生误认老头冲上热搜...
- 这公共市场将迎来众多新餐馆入驻
- 加拿大的国会要重开 这个党尴尬了
- "我们发财啦"! 亚裔男子喜中头奖$8000万
-
- 中国宣布"不参赛"后 韩国棋院更改规则
- 新住房部长:房价无需下降供应增加
- 中美贸易战休战90天 股市应声上涨
- 交易诡才:在中东,看到了川普的伟大
- 温哥华牙医 采用先进技术最新设备
- 中美休战暗藏玄机 恐正酝酿大风暴
-
- 挂了半年 西温千万豪宅再降300万
- 美公开现场照 何立峰小心翼翼"落后半个身位"
- 五熊一家频频上门 女房主不淡定了
- 热帖:2025年最惨的死法就是到杭州?
- 黄仁勋中东行抱回大单! 股价应声大涨
- 太无助了 热汽球着火男子不幸坠亡
-
目前还没有人发表评论, 大家都在期待您的高见