OpenAI 週二正式發布 ChatGPT Images 2.0,不僅大幅提升文字生成的準確度、以及海報與人像上的設計美感。該模型也首度引入「思考模式」,讓圖像生成具備網路搜尋與多圖批量輸出能力,向商業應用場景全面靠攏。
(Canva 宣佈深度整合 Claude,實現將 AI 草稿轉化為設計成品)
Table of Contents
從憑空捏造到完美菜單:AI 終於學會拼字
回顧兩年前,AI 圖像生成模型在文字生成的弱點幾乎人盡皆知,只要提示詞中包含文字需求,輸出結果往往充斥荒謬的拼寫錯誤甚至是憑空捏造,在非英語的中日韓語言中更加嚴重。

如今,ChatGPT Images 2.0 已能生成一張可直接供業者使用的宣傳海報,文字清晰準確。研究人員近年來積極探索自我迴歸模型 (Autoregressive Models) 等新架構,其其運作邏輯、對文字的理解、生成與驗證能力顯著提升。
思考模式上線:連網搜尋、構圖一致性通通到位
ChatGPT Images 2.0最核心的升級在於「思考模式 (Thinking Capabilities)」,目前向 ChatGPT Plus、Pro、商用版及企業版付費用戶開放。啟用後,模型可即時連網搜尋資訊以輔助圖像生成,也能根據用戶上傳的檔案製作對應的視覺化說明圖,並在正式輸出前對圖像內容進行自我審查與優化。
在批量生成方面,思考模式下單一提示詞最多可一次輸出八張圖像,且各圖之間能維持一致的角色形象、物件樣式與整體風格,適合用於漫畫分鏡、社群媒體系列圖文,乃至室內設計的各空間規劃圖。

解析度方面,新模型支援最高 2K 輸出,並新增從 3:1 到 1:3 的多種長寬比選項,進一步滿足各種商業需求。
亞洲語言大幅優化,中日韓用戶有福了!
除英文外,OpenAI 特別指出 Images 2.0 在亞洲文字上的重大優化,日文、韓文與中文等均有明顯改善。
幾天前廣放流傳於中國科技社群的測試文章也驗證了該消息,多位知乎創作者在當時進行了 GPT-Image-2 與競品 Google Nano Banana Pro 的實測比較,包括中文海報設計、電商封面圖、社群媒體介面與數據化圖表等多種場景。

測試結果顯示,GPT-Image-2 在中文字體美感、排版層級與整體設計感上均明顯勝出,生成的海報風格更接近真實商業素材,而非帶有明顯「AI 感」的範本式輸出。文章同時指出,GPT-Image-2 在介面復刻 (如遊戲畫面或通訊軟體截圖) 與真實人像場景的還原上,也展現出更高的細節精準度。
ChatGPT Images 2.0 全面開放,API 同步上線
目前,ChatGPT Images 2.0 已自本週二起向所有 ChatGPT 及 Codex 用戶免費提供基礎功能,付費用戶則可解鎖更進階的輸出效果。與此同時,OpenAI 也同步開放 GPT-Image-2 API,定價依據輸出品質與解析度分級計算,為企業端與開發者提供整合彈性。
值得注意的是,新模型的知識截止日期為 2025 年 12 月,對於涉及最新時事的圖像生成提示詞,準確度可能受到一定限制。此外,複雜構圖的生成速度也無法像一般文字問答即時,但仍僅需幾分鐘。
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。
























