• Latest
  • All
  • Breaking
  • Announcements
  • Learn
  • Analysis
  • Current events
Grok 4.1 新登場:AI 幻覺降 3 倍,情感理解與創意寫作全面升級 

Grok 4.1 新登場:AI 幻覺降 3 倍,情感理解與創意寫作全面升級 

18 11 月, 2025
特斯拉將自建半導體晶圓廠?馬斯克:TeraFab 可解決晶片供應瓶頸 

特斯拉將自建半導體晶圓廠?馬斯克:TeraFab 可解決晶片供應瓶頸 

29 1 月, 2026
Meta 第四季財報亮眼帶動股價跳漲 7%,廣告收入助攻營收逼近 600 億美元 

Meta 第四季財報亮眼帶動股價跳漲 7%,廣告收入助攻營收逼近 600 億美元 

29 1 月, 2026
Chainalysis:中文加密洗錢網路持續擴大,處理非法金流約 161 億美元 

Chainalysis:中文加密洗錢網路持續擴大,處理非法金流約 161 億美元 

29 1 月, 2026
Netflix 改版聚焦垂直短影音,搶攻短影音市場 

Netflix 改版聚焦垂直短影音,搶攻短影音市場 

29 1 月, 2026
CZ 發文掀起負面輿論!幣安上幣黑箱再度成焦點,趙長鵬稱遭到協同攻擊 

CZ 發文掀起負面輿論!幣安上幣黑箱再度成焦點,趙長鵬稱遭到協同攻擊 

29 1 月, 2026
特斯拉財報曝光轉型自動化機器人陣痛:全年營收首見下滑、交車量萎縮一成 

特斯拉財報曝光轉型自動化機器人陣痛:全年營收首見下滑、交車量萎縮一成 

29 1 月, 2026
學歷無用、懂用 AI 才能被錄取,領英推人工智慧鑑定勳章 

學歷無用、懂用 AI 才能被錄取,領英推人工智慧鑑定勳章 

29 1 月, 2026
OpenAI 傳將推出基於 World ID 的社群平台,「真人限定」改善機器人亂象 

OpenAI 傳將推出基於 World ID 的社群平台,「真人限定」改善機器人亂象 

29 1 月, 2026
紅杉資本:SpaceX 成長動能即將釋放,Starship 與太空資料中心成引爆關鍵 

紅杉資本:SpaceX 成長動能即將釋放,Starship 與太空資料中心成引爆關鍵 

29 1 月, 2026
富達將在以太坊上發行自家穩定幣 FIDD,鎖定機構結算與用戶支付 

富達將在以太坊上發行自家穩定幣 FIDD,鎖定機構結算與用戶支付 

29 1 月, 2026

關於8V下架VET(VeChain)的公告

29 1 月, 2026

關於8V下架VTHO(VeThor Token)的公告

29 1 月, 2026
星期四, 29 1 月, 2026
8V加密貨幣學院
8V Academy - 8V.com - Your Cryptocurrency Gateway
  • 關於8V
    • 8V交易所
    • 8V動向
  • 市場動向
    • 今日即時市場數據
    • 突發新聞
    • 加密貨幣
    • 市場行情
    • 法規
    • 交易所
    • 技術
    • GameFi
    • NFT
    • DeFi
    • 其他
  • 8V交易所
    • 公告
    • 活動
      • 進行中活動
      • 已結束活動
    • 產品
      • 功能概覽
      • 資產介紹
      • 虛擬資產交易
        • 現貨交易
        • 合約交易
        • 槓桿交易
      • 複製交易
      • 理財
        • 定存理財
        • 活存理財
      • 加密貨幣支付卡
      • 信用卡買幣
      • 策略交易
    • 交易費率及限額
    • API
    • 推薦好友計劃
    • 漏洞獎勵計劃
    • 常見問題
      • 8V金融卡說明
      • 帳戶指引
      • 充值提幣
      • 合約相關
      • 8V LaunchX協議
      • 其他
  • 學院
    • 加密貨幣如何購買
    • 新手學堂
    • 研究及分析
    • 詞彙概念
  • 業務相關
    • 新幣上架申請
    • 帶單交易員申請
    • 其他合作聯繫
  • 各項政策
    • 私隱政策
    • 服務條款
    • 免責聲明
    • 合規通告
  • 中文 (台灣)
    • English
    • 中文 (台灣)
    • 中文 (中国)
  • 註冊
  • 登入
No Result
View All Result
  • 關於8V
    • 8V交易所
    • 8V動向
  • 市場動向
    • 今日即時市場數據
    • 突發新聞
    • 加密貨幣
    • 市場行情
    • 法規
    • 交易所
    • 技術
    • GameFi
    • NFT
    • DeFi
    • 其他
  • 8V交易所
    • 公告
    • 活動
      • 進行中活動
      • 已結束活動
    • 產品
      • 功能概覽
      • 資產介紹
      • 虛擬資產交易
        • 現貨交易
        • 合約交易
        • 槓桿交易
      • 複製交易
      • 理財
        • 定存理財
        • 活存理財
      • 加密貨幣支付卡
      • 信用卡買幣
      • 策略交易
    • 交易費率及限額
    • API
    • 推薦好友計劃
    • 漏洞獎勵計劃
    • 常見問題
      • 8V金融卡說明
      • 帳戶指引
      • 充值提幣
      • 合約相關
      • 8V LaunchX協議
      • 其他
  • 學院
    • 加密貨幣如何購買
    • 新手學堂
    • 研究及分析
    • 詞彙概念
  • 業務相關
    • 新幣上架申請
    • 帶單交易員申請
    • 其他合作聯繫
  • 各項政策
    • 私隱政策
    • 服務條款
    • 免責聲明
    • 合規通告
  • 中文 (台灣)
    • English
    • 中文 (台灣)
    • 中文 (中国)
  • 註冊
  • 登入
No Result
View All Result
8V加密貨幣學院
No Result
View All Result

8V加密貨幣學院 » Grok 4.1 新登場:AI 幻覺降 3 倍,情感理解與創意寫作全面升級 

Grok 4.1 新登場:AI 幻覺降 3 倍,情感理解與創意寫作全面升級 

18 11 月, 2025
in 其他, 突發新聞, 頭條新聞
Reading Time: 3 mins read
A A

xAI 於 11/17 宣布,最新模型 Grok 4.1 已正式向所有用戶開放,包含 grok.com、推特 (X) 以及 iOS、Android App。xAI 表示,這次升級著重在「真實世界的可用性」,包括更強的情感理解、更自然的人格表現、更高的創作力與更低的幻覺率,同時保留之前 Grok 4 的推理能力與穩定度。

Table of Contents

Toggle

祕密測試勝率近 65%,Grok 4.1 確認全面上線

xAI 先在 11/1 – 11/14 進行兩週的祕密測試,把 Grok 4.1 測試版以小比例導入 Grok.com、X 與手機 App 的真實流量,並透過「盲測比對」與上一版模型 Grok 4 直接 PK。

xAI 表示盲測時,Grok 4.1 在真實流量上的偏好指數為 64.78%,明顯勝過 Grok 4,並宣布於 11/17 正式向所有用戶開放使用。也同時表示從現在起,所有用戶都能使用 Grok 4.1。只要用戶開啟 Auto 模式,它會自動使用 Grok 4.1,用戶也可以在模型選單中自己選。

Grok 4.1 三大技術亮點一次看

Grok 4.1 技術亮點 1:全新強化學習架構,讓回覆更自然也更懂人

Grok 4.1 的核心升級來自於使用與 Grok 4 相同的「大規模強化學習基礎架構」,但這次進一步引入新的方法,讓模型能在更大規模下自動優化回覆。而這次訓練主要著重在不可驗證的回覆品質,像是語氣、人設一致性、情緒互動、理解意圖等,這些都不是單靠資料就能直接評分的。

為了解決這個問題,xAI 使用了「前沿推理模型」作為獎勵模型 (Reward Model),讓這些具備深度推理能力的 AI 來自動評估 Grok 4.1 的回覆,並在大量的比較中自行學習什麼是更好、更符合人類期待的回答,並且做調整。因此 Grok 4.1 在語氣、個性、情緒、互動自然度上明顯提升,同時保持原本的推理能力與穩定性。

Grok 4.1 技術亮點 2:盲測評比全面登頂,情緒理解與創作力大幅升級

xAI 也公布多項實測結果,顯示 Grok 4.1 在多個能力測試上都有明顯提升。

  • 在 LMArena 全球盲測對戰平台中:

    • Grok 4.1 Thinking 以 1483 Elo 排名世界第一。

    • Grok 4.1 Non-Thinking 以 1465 Elo 排名第二,甚至超越其他模型的「完整推理模式」。

  • 情緒理解測試 (EQ-Bench 3):採用 45 個高難度情境與 3 回合互動,由 Claude Sonnet 3.7 評分。Grok 4.1 在同理心、情緒洞察、人際理解等方面表現顯著提升。

  • 創意寫作能力 (Creative Writing v3):在 32 題 × 3 回合的寫作測試中,Grok 4.1 在創作風格、敘事品質、故事流暢度上都有更高分數,官方並展示多個樣本回覆。

整體來看,Grok 4.1 不只在推理力提升,而是在「情感互動」與「創作能力」方面也有明顯升級。

從圖可得知,Grok 4.1 在推理模型綜合排名、情緒理解與創意寫作比較上,皆佔前三名。

(註:Elo,意指 Grok 4.1 在全球盲測平台 LMArena 上的戰力分數,採用原本用於西洋棋的 Elo 排名系統來評比模型回覆優劣。)

RelatedPosts

特斯拉將自建半導體晶圓廠?馬斯克:TeraFab 可解決晶片供應瓶頸 

Meta 第四季財報亮眼帶動股價跳漲 7%,廣告收入助攻營收逼近 600 億美元 

Chainalysis:中文加密洗錢網路持續擴大,處理非法金流約 161 億美元 

Netflix 改版聚焦垂直短影音,搶攻短影音市場 

Grok 4.1 技術亮點 3: AI 幻覺下降 3 倍,資訊來源更可靠

對於常見的資訊查詢類問題,xAI 特別強調 Grok 4.1 的幻覺率明顯下降。先前 Gork 的快速模式 (Non-Reasoning) 原本容易因推理深度不足而出現幻覺,但在 4.1 的後訓練中,xAI 明確針對這問題進行改善。xAI 的驗證方式包括:

  • 從用戶在真實情況下問的、真正出現在平台上的問題,來進行抽樣測試。

  • 對照 Grok 4.1 與舊版模型的回答差異。

  • 評估在 FActScore 上的表現。

結果顯示,新版本在查詢事實、回覆資訊性問題時,幻覺率明顯下降,回答更穩定、更可信。使得 Grok 4.1 在「快速答題」與「查資料」的場景中,比前代版本更實用、更精準。

從圖可得知,Grok 4.1 的幻覺率從 12.09% 下降至 4.22%,下降約三倍。事實驗證評分 (FActScore) 也從 9.89% 降到 2.97%,表示 Grok 4.1 準確度有大幅改善。

(註:FActScore 為由 500 題真實人物傳記問題組成的公開測試,用來檢驗模型在搜尋事實、判斷正確性與回答一致性上的表現,可稱作驗證事實評分。)

(2025 最新五大主流 AI 語言模型 (LLM) 全解析,付費、應用與安全性一次看懂)

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。


Bitget 普發金活動

   

Previous Post

盜用馬斯克等名人帳號的英國駭客被捕、法院勒令償還 400 萬英鎊加密貨幣 

Next Post

Arthur Hayes 解讀市場下跌主因:比特幣最糟下看 8 萬鎂,仍待流動性回歸 

Related Posts

特斯拉將自建半導體晶圓廠?馬斯克:TeraFab 可解決晶片供應瓶頸 
其他

特斯拉將自建半導體晶圓廠?馬斯克:TeraFab 可解決晶片供應瓶頸 

29 1 月, 2026
Meta 第四季財報亮眼帶動股價跳漲 7%,廣告收入助攻營收逼近 600 億美元 
其他

Meta 第四季財報亮眼帶動股價跳漲 7%,廣告收入助攻營收逼近 600 億美元 

29 1 月, 2026
Chainalysis:中文加密洗錢網路持續擴大,處理非法金流約 161 億美元 
其他

Chainalysis:中文加密洗錢網路持續擴大,處理非法金流約 161 億美元 

29 1 月, 2026
Netflix 改版聚焦垂直短影音,搶攻短影音市場 
其他

Netflix 改版聚焦垂直短影音,搶攻短影音市場 

29 1 月, 2026
CZ 發文掀起負面輿論!幣安上幣黑箱再度成焦點,趙長鵬稱遭到協同攻擊 
其他

CZ 發文掀起負面輿論!幣安上幣黑箱再度成焦點,趙長鵬稱遭到協同攻擊 

29 1 月, 2026
特斯拉財報曝光轉型自動化機器人陣痛:全年營收首見下滑、交車量萎縮一成 
其他

特斯拉財報曝光轉型自動化機器人陣痛:全年營收首見下滑、交車量萎縮一成 

29 1 月, 2026
Next Post
Arthur Hayes 解讀市場下跌主因:比特幣最糟下看 8 萬鎂,仍待流動性回歸 

Arthur Hayes 解讀市場下跌主因:比特幣最糟下看 8 萬鎂,仍待流動性回歸 

Please login to join discussion
No Result
View All Result
深入分析 穩定幣脫鉤 DeFi USDX事件
研究及分析

深入分析 穩定幣脫鉤 DeFi USDX事件

by 8V
10 11 月, 2025
0

上週穩定幣脫鈎,去中心化金融(DeFi)...

Read moreDetails
$60 Million Mistake, $19 Billion Nightmare: How Oracle Broke the Crypto Market

6000 萬美元的錯誤,190 億美元的噩夢:報價預言機如何摧毀加密貨幣市場

21 10 月, 2025
8V深度分析Aave V3借贷机制、流动性和风险管理

8V深度分析Aave V3借貸機制、流動性與風險管理

30 9 月, 2025
Polymarket和8V交易所對加密貨幣產業的意義

Polymarket和8V交易所對加密貨幣產業的意義

16 9 月, 2025
2025 年第四季至 2026 年第四季值得關注的十大山寨幣

2025 年第四季至 2026 年第四季值得關注的十大山寨幣

21 5 月, 2025
8v.com - download APP 8v.com - download APP 8v.com - download APP
  • 關於8V
  • 下載APP
  • 公告
  • 突發新聞
  • RSS訂閱
  • 常見問題
  • 服務條款
  • 私隱政策
  • 免責聲明

© 2025 8V.com - 8V Crypto Academy - Empower your crypto journey! 8V.com

No Result
View All Result
  • 關於8V
    • 8V交易所
    • 8V動向
  • 市場動向
    • 今日即時市場數據
    • 突發新聞
    • 加密貨幣
    • 市場行情
    • 法規
    • 交易所
    • 技術
    • GameFi
    • NFT
    • DeFi
    • 其他
  • 8V交易所
    • 公告
    • 活動
      • 進行中活動
      • 已結束活動
    • 產品
      • 功能概覽
      • 資產介紹
      • 虛擬資產交易
      • 複製交易
      • 理財
      • 加密貨幣支付卡
      • 信用卡買幣
      • 策略交易
    • 交易費率及限額
    • API
    • 推薦好友計劃
    • 漏洞獎勵計劃
    • 常見問題
      • 8V金融卡說明
      • 帳戶指引
      • 充值提幣
      • 合約相關
      • 8V LaunchX協議
      • 其他
  • 學院
    • 加密貨幣如何購買
    • 新手學堂
    • 研究及分析
    • 詞彙概念
  • 業務相關
    • 新幣上架申請
    • 帶單交易員申請
    • 其他合作聯繫
  • 各項政策
    • 私隱政策
    • 服務條款
    • 免責聲明
    • 合規通告
  • 中文 (台灣)
    • English
    • 中文 (台灣)
    • 中文 (中国)
  • 註冊
  • 登入

© 2025 8V.com - 8V Crypto Academy - Empower your crypto journey! 8V.com