阿里雲通義千問團隊近日宣布推出全新多模態統一模型 Qwen VLo,並開放用戶於 Qwen Chat(chat.qwen.ai)體驗。該模型具備圖文理解與生成能力,最大亮點為其漸進式圖像生成機制,能從上至下、左至右逐步構建圖片,並在過程中持續調整優化,提升整體一致性與視覺品質。
Qwen VLo 採用動態解析度訓練技術,支援任意長寬比與解析度圖像的輸入與輸出,突破傳統模型格式限制,廣泛適用於海報設計、網頁 Banner、插畫及社群封面等場景。
此外,Qwen VLo 特別針對含大量文字的圖像生成需求(如廣告、漫畫分鏡等),提供可視化漸進式控制,用戶可在生成過程中即時調整內容,以提升創作靈活度與準確性。
阿里雲強調,Qwen VLo 目前仍處於預覽階段,可能出現事實不符或與原圖不一致等問題,團隊將持續優化模型表現與生成質量。(編輯部)