-
日期: 2025-05-16 | 來源: 中時新聞網 | 有0人參與評論 | 字體: 小 中 大
據《快科技》報道,騰訊混元圖像2.0相比前代模型,其參數量提升了一個數量級,得益於超高壓縮倍率的圖像轉碼器以及全新擴散架構,其生圖速度顯著快於行業領先模型。
報道指出,在同類商業產品每張圖推理速度需要5到10秒的情況下,騰訊混元可實現“毫秒級”回應,支持用戶可以一邊打字或者一邊說話一邊出圖,改變了傳統“抽卡—等待—抽卡”的方式。
除了速度快以外,騰訊混元圖像2.0模型圖像生成品質提升明顯,通過強化學習等演算法以及引入大量人類美學知識對齊,生成的圖像可有效避免AIGC圖像中的“AI味”,真實感強、細節豐富、可用性高。
在圖像生成領域專門測試模型復雜文本指令理解與生成能力的評估基准GenEval(Geneval Bench)上,騰訊混元圖像2.0模型准確率超過95%,遠超其他同類模型。
騰訊表示,騰訊混元圖像2.0引入多模態大語言模型(MLLM)作為文本編碼器,配合自研的結構化caption系統,不僅能理解你在說什麼,更能推測出你希望畫面“怎麼表達”。哪怕你一句話裡埋了三層含義,它也能一一拆解,再一筆一筆劃出來。
報道說,除了文字輸入,騰訊混元圖像2.0還可以通過語音直接輸入提示詞,系統將語音自動轉寫為文字,並在識別後即時生成圖像,適用於直播講解、移動創作等場景。
也可以上傳草圖作為參考,模型能自動識別線稿的結構與構圖邏輯,再結合提示詞內容補全光影、材質、背景等細節,迅速擴展成圖。
提示詞:“人像攝影,愛因斯坦,背景是東方明珠,自拍視角”在混元圖像2.0生成的超寫實畫質AI圖片。(圖/騰訊混元AI)- 新聞來源於其它媒體,內容不代表本站立場!
- "休戰"90天 中國對美出口商樂觀不起來
- 溫西比佛利山莊風格豪宅要這價錢
- 卡尼兌現承諾 第一步要為中產減稅
-
- 黃石公園慘劇 遇難中國游客是他們
- 淑妃控告溥儀虐待 內容曝光 溥儀崩潰
- 加國工程系學生爆料 建商索賠30萬
- 不卷了 UBC女生輟學買老店掙錢去
- 振龍電器 各類熱銷家電 種類齊全
- 加國2幼童失蹤2周 網上胡說有麻煩
-
- 中美休戰暗藏玄機 恐正醞釀大風暴
- 智庫:加國聯邦應裁員6.4萬 省百億
- 曾經不堪設想的局面,如何變成美中貿易新常態
- 英偉達大漲!全球總部將設在台灣 簽下大單
- 黃仁勳中東行抱回大單! 股價應聲大漲
- 自由黨1票領先的這選區又有新情況
-
- 川普訪沙特 這句話引來全場起立致敬
- 魔鬼藏在細節中,日內瓦協議中共自取其辱
- 溫哥華街頭襲擊案 ICBC賠償引爭議
- 廣東耗資10億豪宅將被強拆 引爆輿論
- 蘭裡地產專家 多年蘭裡地產經驗
- 新冠再來襲,專家提醒:當前正處於小波峰
-
目前還沒有人發表評論, 大家都在期待您的高見