• Latest
  • All
  • Breaking
  • Announcements
  • Learn
  • Analysis
  • Current events
Grok 4.1 新登場:AI 幻覺降 3 倍,情感理解與創意寫作全面升級 

Grok 4.1 新登場:AI 幻覺降 3 倍,情感理解與創意寫作全面升級 

18 11 月, 2025

馬斯克證實:SpaceX 最快 2026 年公開上市,AI 與太空數據中心會是關鍵 

13 12 月, 2025
Tether 禁止股東低價賣股,考慮代幣化其股票,目標估值五千億鎂 

Tether 禁止股東低價賣股,考慮代幣化其股票,目標估值五千億鎂 

13 12 月, 2025
Circle 和 Ripple 等加密公司獲 OCC 國家信託銀行牌照 

Circle 和 Ripple 等加密公司獲 OCC 國家信託銀行牌照 

13 12 月, 2025
Vanguard:比特幣是數位版 Labubu,是投機性收藏品 

Vanguard:比特幣是數位版 Labubu,是投機性收藏品 

13 12 月, 2025

Bitget 推出全新升級版 GetAgent AI 交易助理,所有用戶免費開放使用 

12 12 月, 2025
Phantom 與 Kalshi 合作,加密貨幣用戶可直接在錢包內開倉下注、參與預測市場 

Phantom 與 Kalshi 合作,加密貨幣用戶可直接在錢包內開倉下注、參與預測市場 

12 12 月, 2025
台灣人最常用的美股海外券商:盈透證券 (Interactive Brokers) 開放穩定幣入金 

台灣人最常用的美股海外券商:盈透證券 (Interactive Brokers) 開放穩定幣入金 

12 12 月, 2025
迪士尼授權經典角色給 OpenAI,入股 10 億美元布局 AI 影音未來 

迪士尼授權經典角色給 OpenAI,入股 10 億美元布局 AI 影音未來 

12 12 月, 2025
YouTube 攜手 PayPal 開放創作者以穩定幣收款,科技巨頭踏入加密支付時代 

YouTube 攜手 PayPal 開放創作者以穩定幣收款,科技巨頭踏入加密支付時代 

12 12 月, 2025
深陷爭議的 Movement 共同創辦人 Rushi 成立 Nyx Group,計畫投入一億美元 

深陷爭議的 Movement 共同創辦人 Rushi 成立 Nyx Group,計畫投入一億美元 

12 12 月, 2025
博通 (Broadcom) Q4 財報超預期!接下 Google TPU 百億美金大單,股價反跌 4.6% 

博通 (Broadcom) Q4 財報超預期!接下 Google TPU 百億美金大單,股價反跌 4.6% 

12 12 月, 2025
小米手機將預先安裝加密貨幣錢包?KOL 質疑假合作,SEI 官方緊急回應了 

小米手機將預先安裝加密貨幣錢包?KOL 質疑假合作,SEI 官方緊急回應了 

12 12 月, 2025
星期六, 13 12 月, 2025
8V加密貨幣學院
8V Academy - 8V.com - Your Cryptocurrency Gateway
  • 關於8V
    • 8V交易所
    • 8V動向
  • 市場動向
    • 今日即時市場數據
    • 突發新聞
    • 加密貨幣
    • 市場行情
    • 法規
    • 交易所
    • 技術
    • GameFi
    • NFT
    • DeFi
    • 其他
  • 8V交易所
    • 公告
    • 活動
      • 進行中活動
      • 已結束活動
    • 產品
      • 功能概覽
      • 資產介紹
      • 虛擬資產交易
        • 現貨交易
        • 合約交易
        • 槓桿交易
      • 複製交易
      • 理財
        • 定存理財
        • 活存理財
      • 加密貨幣支付卡
      • 信用卡買幣
      • 策略交易
    • 交易費率及限額
    • API
    • 推薦好友計劃
    • 漏洞獎勵計劃
    • 常見問題
      • 8V金融卡說明
      • 帳戶指引
      • 充值提幣
      • 合約相關
      • 8V LaunchX協議
      • 其他
  • 學院
    • 加密貨幣如何購買
    • 新手學堂
    • 研究及分析
    • 詞彙概念
  • 業務相關
    • 新幣上架申請
    • 帶單交易員申請
    • 其他合作聯繫
  • 各項政策
    • 私隱政策
    • 服務條款
    • 免責聲明
    • 合規通告
  • 中文 (台灣)
    • English
    • 中文 (台灣)
    • 中文 (中国)
  • 註冊
  • 登入
No Result
View All Result
  • 關於8V
    • 8V交易所
    • 8V動向
  • 市場動向
    • 今日即時市場數據
    • 突發新聞
    • 加密貨幣
    • 市場行情
    • 法規
    • 交易所
    • 技術
    • GameFi
    • NFT
    • DeFi
    • 其他
  • 8V交易所
    • 公告
    • 活動
      • 進行中活動
      • 已結束活動
    • 產品
      • 功能概覽
      • 資產介紹
      • 虛擬資產交易
        • 現貨交易
        • 合約交易
        • 槓桿交易
      • 複製交易
      • 理財
        • 定存理財
        • 活存理財
      • 加密貨幣支付卡
      • 信用卡買幣
      • 策略交易
    • 交易費率及限額
    • API
    • 推薦好友計劃
    • 漏洞獎勵計劃
    • 常見問題
      • 8V金融卡說明
      • 帳戶指引
      • 充值提幣
      • 合約相關
      • 8V LaunchX協議
      • 其他
  • 學院
    • 加密貨幣如何購買
    • 新手學堂
    • 研究及分析
    • 詞彙概念
  • 業務相關
    • 新幣上架申請
    • 帶單交易員申請
    • 其他合作聯繫
  • 各項政策
    • 私隱政策
    • 服務條款
    • 免責聲明
    • 合規通告
  • 中文 (台灣)
    • English
    • 中文 (台灣)
    • 中文 (中国)
  • 註冊
  • 登入
No Result
View All Result
8V加密貨幣學院
No Result
View All Result

8V加密貨幣學院 » Grok 4.1 新登場:AI 幻覺降 3 倍,情感理解與創意寫作全面升級 

Grok 4.1 新登場:AI 幻覺降 3 倍,情感理解與創意寫作全面升級 

18 11 月, 2025
in 其他, 突發新聞, 頭條新聞
Reading Time: 3 mins read
A A

xAI 於 11/17 宣布,最新模型 Grok 4.1 已正式向所有用戶開放,包含 grok.com、推特 (X) 以及 iOS、Android App。xAI 表示,這次升級著重在「真實世界的可用性」,包括更強的情感理解、更自然的人格表現、更高的創作力與更低的幻覺率,同時保留之前 Grok 4 的推理能力與穩定度。

Table of Contents

Toggle

祕密測試勝率近 65%,Grok 4.1 確認全面上線

xAI 先在 11/1 – 11/14 進行兩週的祕密測試,把 Grok 4.1 測試版以小比例導入 Grok.com、X 與手機 App 的真實流量,並透過「盲測比對」與上一版模型 Grok 4 直接 PK。

xAI 表示盲測時,Grok 4.1 在真實流量上的偏好指數為 64.78%,明顯勝過 Grok 4,並宣布於 11/17 正式向所有用戶開放使用。也同時表示從現在起,所有用戶都能使用 Grok 4.1。只要用戶開啟 Auto 模式,它會自動使用 Grok 4.1,用戶也可以在模型選單中自己選。

Grok 4.1 三大技術亮點一次看

Grok 4.1 技術亮點 1:全新強化學習架構,讓回覆更自然也更懂人

Grok 4.1 的核心升級來自於使用與 Grok 4 相同的「大規模強化學習基礎架構」,但這次進一步引入新的方法,讓模型能在更大規模下自動優化回覆。而這次訓練主要著重在不可驗證的回覆品質,像是語氣、人設一致性、情緒互動、理解意圖等,這些都不是單靠資料就能直接評分的。

為了解決這個問題,xAI 使用了「前沿推理模型」作為獎勵模型 (Reward Model),讓這些具備深度推理能力的 AI 來自動評估 Grok 4.1 的回覆,並在大量的比較中自行學習什麼是更好、更符合人類期待的回答,並且做調整。因此 Grok 4.1 在語氣、個性、情緒、互動自然度上明顯提升,同時保持原本的推理能力與穩定性。

Grok 4.1 技術亮點 2:盲測評比全面登頂,情緒理解與創作力大幅升級

xAI 也公布多項實測結果,顯示 Grok 4.1 在多個能力測試上都有明顯提升。

  • 在 LMArena 全球盲測對戰平台中:

    • Grok 4.1 Thinking 以 1483 Elo 排名世界第一。

    • Grok 4.1 Non-Thinking 以 1465 Elo 排名第二,甚至超越其他模型的「完整推理模式」。

  • 情緒理解測試 (EQ-Bench 3):採用 45 個高難度情境與 3 回合互動,由 Claude Sonnet 3.7 評分。Grok 4.1 在同理心、情緒洞察、人際理解等方面表現顯著提升。

    RelatedPosts

    馬斯克證實:SpaceX 最快 2026 年公開上市,AI 與太空數據中心會是關鍵 

    Tether 禁止股東低價賣股,考慮代幣化其股票,目標估值五千億鎂 

    Circle 和 Ripple 等加密公司獲 OCC 國家信託銀行牌照 

    Vanguard:比特幣是數位版 Labubu,是投機性收藏品 

  • 創意寫作能力 (Creative Writing v3):在 32 題 × 3 回合的寫作測試中,Grok 4.1 在創作風格、敘事品質、故事流暢度上都有更高分數,官方並展示多個樣本回覆。

整體來看,Grok 4.1 不只在推理力提升,而是在「情感互動」與「創作能力」方面也有明顯升級。

從圖可得知,Grok 4.1 在推理模型綜合排名、情緒理解與創意寫作比較上,皆佔前三名。

(註:Elo,意指 Grok 4.1 在全球盲測平台 LMArena 上的戰力分數,採用原本用於西洋棋的 Elo 排名系統來評比模型回覆優劣。)

Grok 4.1 技術亮點 3: AI 幻覺下降 3 倍,資訊來源更可靠

對於常見的資訊查詢類問題,xAI 特別強調 Grok 4.1 的幻覺率明顯下降。先前 Gork 的快速模式 (Non-Reasoning) 原本容易因推理深度不足而出現幻覺,但在 4.1 的後訓練中,xAI 明確針對這問題進行改善。xAI 的驗證方式包括:

  • 從用戶在真實情況下問的、真正出現在平台上的問題,來進行抽樣測試。

  • 對照 Grok 4.1 與舊版模型的回答差異。

  • 評估在 FActScore 上的表現。

結果顯示,新版本在查詢事實、回覆資訊性問題時,幻覺率明顯下降,回答更穩定、更可信。使得 Grok 4.1 在「快速答題」與「查資料」的場景中,比前代版本更實用、更精準。

從圖可得知,Grok 4.1 的幻覺率從 12.09% 下降至 4.22%,下降約三倍。事實驗證評分 (FActScore) 也從 9.89% 降到 2.97%,表示 Grok 4.1 準確度有大幅改善。

(註:FActScore 為由 500 題真實人物傳記問題組成的公開測試,用來檢驗模型在搜尋事實、判斷正確性與回答一致性上的表現,可稱作驗證事實評分。)

(2025 最新五大主流 AI 語言模型 (LLM) 全解析,付費、應用與安全性一次看懂)

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。


Bitget 普發金活動

   

Previous Post

盜用馬斯克等名人帳號的英國駭客被捕、法院勒令償還 400 萬英鎊加密貨幣 

Next Post

Arthur Hayes 解讀市場下跌主因:比特幣最糟下看 8 萬鎂,仍待流動性回歸 

Related Posts

其他

馬斯克證實:SpaceX 最快 2026 年公開上市,AI 與太空數據中心會是關鍵 

13 12 月, 2025
Tether 禁止股東低價賣股,考慮代幣化其股票,目標估值五千億鎂 
其他

Tether 禁止股東低價賣股,考慮代幣化其股票,目標估值五千億鎂 

13 12 月, 2025
Circle 和 Ripple 等加密公司獲 OCC 國家信託銀行牌照 
其他

Circle 和 Ripple 等加密公司獲 OCC 國家信託銀行牌照 

13 12 月, 2025
Vanguard:比特幣是數位版 Labubu,是投機性收藏品 
其他

Vanguard:比特幣是數位版 Labubu,是投機性收藏品 

13 12 月, 2025
其他

Bitget 推出全新升級版 GetAgent AI 交易助理,所有用戶免費開放使用 

12 12 月, 2025
Phantom 與 Kalshi 合作,加密貨幣用戶可直接在錢包內開倉下注、參與預測市場 
其他

Phantom 與 Kalshi 合作,加密貨幣用戶可直接在錢包內開倉下注、參與預測市場 

12 12 月, 2025
Next Post
Arthur Hayes 解讀市場下跌主因:比特幣最糟下看 8 萬鎂,仍待流動性回歸 

Arthur Hayes 解讀市場下跌主因:比特幣最糟下看 8 萬鎂,仍待流動性回歸 

Please login to join discussion
No Result
View All Result
深入分析 穩定幣脫鉤 DeFi USDX事件
研究及分析

深入分析 穩定幣脫鉤 DeFi USDX事件

by 8V
10 11 月, 2025
0

上週穩定幣脫鈎,去中心化金融(DeFi)...

Read moreDetails
$60 Million Mistake, $19 Billion Nightmare: How Oracle Broke the Crypto Market

6000 萬美元的錯誤,190 億美元的噩夢:報價預言機如何摧毀加密貨幣市場

21 10 月, 2025
8V深度分析Aave V3借贷机制、流动性和风险管理

8V深度分析Aave V3借貸機制、流動性與風險管理

30 9 月, 2025
Polymarket和8V交易所對加密貨幣產業的意義

Polymarket和8V交易所對加密貨幣產業的意義

16 9 月, 2025
2025 年第四季至 2026 年第四季值得關注的十大山寨幣

2025 年第四季至 2026 年第四季值得關注的十大山寨幣

21 5 月, 2025
8v.com - download APP 8v.com - download APP 8v.com - download APP
  • 關於8V
  • 下載APP
  • 公告
  • 突發新聞
  • RSS訂閱
  • 常見問題
  • 服務條款
  • 私隱政策
  • 免責聲明

© 2025 8V.com - 8V Crypto Academy - Empower your crypto journey! 8V.com

No Result
View All Result
  • 關於8V
    • 8V交易所
    • 8V動向
  • 市場動向
    • 今日即時市場數據
    • 突發新聞
    • 加密貨幣
    • 市場行情
    • 法規
    • 交易所
    • 技術
    • GameFi
    • NFT
    • DeFi
    • 其他
  • 8V交易所
    • 公告
    • 活動
      • 進行中活動
      • 已結束活動
    • 產品
      • 功能概覽
      • 資產介紹
      • 虛擬資產交易
      • 複製交易
      • 理財
      • 加密貨幣支付卡
      • 信用卡買幣
      • 策略交易
    • 交易費率及限額
    • API
    • 推薦好友計劃
    • 漏洞獎勵計劃
    • 常見問題
      • 8V金融卡說明
      • 帳戶指引
      • 充值提幣
      • 合約相關
      • 8V LaunchX協議
      • 其他
  • 學院
    • 加密貨幣如何購買
    • 新手學堂
    • 研究及分析
    • 詞彙概念
  • 業務相關
    • 新幣上架申請
    • 帶單交易員申請
    • 其他合作聯繫
  • 各項政策
    • 私隱政策
    • 服務條款
    • 免責聲明
    • 合規通告
  • 中文 (台灣)
    • English
    • 中文 (台灣)
    • 中文 (中国)
  • 註冊
  • 登入

© 2025 8V.com - 8V Crypto Academy - Empower your crypto journey! 8V.com