阿里雲發布Qwen VLo多模態模型

推出可控漸進式圖像生成能力
29/06/2025
4790
收藏
分享
推出可控漸進式圖像生成能力

阿里雲通義千問團隊近日宣布推出全新多模態統一模型 Qwen VLo,並開放用戶於 Qwen Chat(chat.qwen.ai)體驗。該模型具備圖文理解與生成能力,最大亮點為其漸進式圖像生成機制,能從上至下、左至右逐步構建圖片,並在過程中持續調整優化,提升整體一致性與視覺品質。

Qwen VLo 採用動態解析度訓練技術,支援任意長寬比與解析度圖像的輸入與輸出,突破傳統模型格式限制,廣泛適用於海報設計、網頁 Banner、插畫及社群封面等場景。

此外,Qwen VLo 特別針對含大量文字的圖像生成需求(如廣告、漫畫分鏡等),提供可視化漸進式控制,用戶可在生成過程中即時調整內容,以提升創作靈活度與準確性。

阿里雲強調,Qwen VLo 目前仍處於預覽階段,可能出現事實不符或與原圖不一致等問題,團隊將持續優化模型表現與生成質量。(編輯部)

檢舉
檢舉類型:
具體描述:
提交
取消
評論
發佈

力報會員可享用評論功能

註冊 / 登錄

查看更多評論
收藏
分享

相關新聞

推薦新聞

找不到相關內容

七日預報