我們擅長(cháng)商業(yè)策略與用戶(hù)體驗的完美結合。
歡迎瀏覽我們的案例。
OpenAI 周二正式發(fā)布新一代默認模型 GPT?5.3 Instant,并開(kāi)始向全部 ChatGPT 用戶(hù)推送更新。相比此前的 GPT?5.2 Instant,新模型在高風(fēng)險場(chǎng)景中的錯誤“幻覺(jué)”率最高下降 26.8%,同時(shí)明顯減少不必要的拒答與帶有說(shuō)教色彩的免責聲明式開(kāi)場(chǎng)。GPT?5.2 Instant 將被移入付費用戶(hù)可見(jiàn)的“舊版模型”專(zhuān)區,并計劃于 6 月 3 日正式下線(xiàn)。

根據 OpenAI 發(fā)布的博客和系統卡片,團隊在兩類(lèi)內部評估中衡量了這次升級的效果:一是聚焦醫療、法律、金融等高風(fēng)險領(lǐng)域的測試,二是對真實(shí) ChatGPT 對話(huà)中被用戶(hù)標記為事實(shí)錯誤的回答進(jìn)行回溯評估。在高風(fēng)險測試中,啟用聯(lián)網(wǎng)搜索時(shí),GPT?5.3 Instant 的幻覺(jué)率較 5.2 版下降 26.8%,僅依賴(lài)自身知識時(shí)則下降 19.7%;在用戶(hù)標記錯誤的對話(huà)樣本上,聯(lián)網(wǎng)場(chǎng)景下降 22.5%,離線(xiàn)場(chǎng)景下降 9.6%。不過(guò),OpenAI 僅給出了相對改善幅度,并未披露 GPT?5.2 的絕對錯誤基線(xiàn),這也讓“降低了 27%”這一表述的實(shí)際含義仍留有空間。
此次更新落地的時(shí)間點(diǎn)并不輕松。就在上周,OpenAI 與美國國防部簽署部署協(xié)議的消息引發(fā)強烈反彈,美國區 ChatGPT 卸載量在 2 月 28 日單日激增 295%,抗議者在舊金山總部外集會(huì ),競品 Anthropic 的 Claude 一度登上蘋(píng)果 App Store 榜首。OpenAI 首席執行官 Sam Altman 隨后公開(kāi)將這份國防部協(xié)議稱(chēng)為“草率”,并承諾修訂條款。在這樣的輿論背景下繼續按計劃發(fā)版,既可以被視為“頂住壓力”,也可能只是團隊堅持不隨輿情打亂技術(shù)發(fā)布節奏。
在具體產(chǎn)品層面,GPT?5.3 Instant 首先瞄準的是用戶(hù)日常使用中最“硌手”的體驗——那些難以在基準測試中量化,卻頻繁出現在對話(huà)里的小摩擦。OpenAI 罕見(jiàn)地坦率承認,5.2 版本過(guò)于保守,經(jīng)常在可以正常作答的場(chǎng)景下先行拒絕,或對用戶(hù)進(jìn)行不請自來(lái)的風(fēng)險提醒和道德說(shuō)教,甚至在開(kāi)頭堆疊冗長(cháng)的免責聲明式前言。
在新版中,模型的拒答閾值被重新校準:當問(wèn)題本身存在明確、合理的回答空間時(shí),GPT?5.3 Instant 會(huì )更直接給出有用信息,而不是先解釋“自己不能做什么”。例如在一條關(guān)于射箭彈道計算的測試提示中,GPT?5.2 Instant 先是一大段關(guān)于限制和風(fēng)險的鋪墊,才進(jìn)入物理推導;GPT?5.3 Instant 則直接從相關(guān)物理公式切入,不再附帶多余前綴。
聯(lián)網(wǎng)回答的策略也有所調整。此前的版本容易“過(guò)度倚重”搜索結果,給出的回復更像拼湊出的研究摘要,把檢索到的網(wǎng)頁(yè)內容逐條轉述。GPT?5.3 Instant 在權衡模型自有知識與外部搜索時(shí)更加克制,優(yōu)先組織和呈現對當前問(wèn)題最相關(guān)的信息,而不是羅列類(lèi)似“鏈接列表式”的綜合概覽。
除了準確率和拒答策略,OpenAI 將這次升級中的“語(yǔ)氣調整”視作明確的產(chǎn)品決策。官方在系統卡片中直言,GPT?5.2 Instant 的對話(huà)風(fēng)格有時(shí)會(huì )讓人感覺(jué)“cringe”(尷尬、讓人起雞皮疙瘩),典型表現包括在用戶(hù)僅提出事實(shí)性問(wèn)題時(shí),模型卻主動(dòng)給出諸如“首先,你并沒(méi)有問(wèn)題”“先停一下,深呼吸”這類(lèi)心理安撫式開(kāi)場(chǎng),好像默認對方正處于情緒危機。
在 GPT?5.3 Instant 中,這類(lèi)未經(jīng)請求的安撫與“雞湯式”話(huà)術(shù)被系統性剔除。用戶(hù)仍可以在設置中調整模型的親和度和熱情程度,但默認人格不再預設用戶(hù)需要“情緒治療”,而是更聚焦于任務(wù)本身。OpenAI 將此歸類(lèi)為一致性工程的一部分,希望未來(lái)每次能力升級,不再讓用戶(hù)覺(jué)得“人格被換了一個(gè)”,而是體驗到同一個(gè)助手能力的平滑增強。
文案和創(chuàng )作方面的能力同樣獲得打磨。OpenAI 聲稱(chēng) GPT?5.3 Instant 在小說(shuō)、文風(fēng)潤色與創(chuàng )意探索上的表現更有層次。在官方給出的詩(shī)歌對比示例中,新模型生成的作品在意象和畫(huà)面感上更緊湊、更具可感性,而 GPT?5.2 Instant 則更依賴(lài)抽象概念和情緒宣泄。盡管這類(lèi)評估帶有主觀(guān)色彩,但也反映出團隊將寫(xiě)作質(zhì)量視作差異化的一個(gè)方向。
在多語(yǔ)言體驗上,OpenAI 則態(tài)度謹慎。公司坦承,目前 GPT?5.3 Instant 在日語(yǔ)、韓語(yǔ)等語(yǔ)言上的回復依舊顯得生硬,語(yǔ)氣自然度與英語(yǔ)存在明顯差距,多語(yǔ)言的語(yǔ)氣與風(fēng)格優(yōu)化仍是長(cháng)期工作。目前這輪“去說(shuō)教化”的語(yǔ)氣調整主要集中在英語(yǔ)場(chǎng)景,尚未能全面覆蓋其他語(yǔ)言。
就產(chǎn)品生命周期而言,GPT?5.2 Instant 仍將在未來(lái)三個(gè)月內以“舊版模型”形式對付費用戶(hù)開(kāi)放,正式退役時(shí)間定于 2026 年 6 月 3 日。開(kāi)發(fā)者則可通過(guò) API 使用新模型,模型標識為“gpt?5.3?chat?latest”。OpenAI 表示,面向更復雜推理場(chǎng)景的 Thinking 版以及 Pro 高級版本也將迎來(lái)相應更新,但尚未給出具體時(shí)間表,目前本次發(fā)布僅涉及 Instant 系列。
在安全架構上,GPT?5.3 Instant 延續了 GPT?5.2 階段確立的整體框架,相關(guān)說(shuō)明在此前的系統卡片中已有披露。這意味著(zhù),OpenAI 押注的不是重寫(xiě)安全基建,而是在現有框架下更精細地調校拒答邊界與內容策略,將“該說(shuō)不說(shuō)”與“過(guò)度防御”的比例壓低。至于更少的拒絕、更直接的語(yǔ)氣能否轉化為切實(shí)可感的產(chǎn)品改善,則要看每周與模型交互的 9 億用戶(hù)在接下來(lái)一段時(shí)間內給出的反饋,而非系統卡片中的曲線(xiàn)與百分比。
在常見(jiàn)問(wèn)答部分,OpenAI 將 GPT?5.3 Instant 定義為 ChatGPT 的最新默認模型,用以取代 GPT?5.2 Instant,核心特征是降低幻覺(jué)、減少不必要的拒答,并提供更加克制、少說(shuō)教的對話(huà)語(yǔ)氣;該模型同時(shí)向普通用戶(hù)和開(kāi)發(fā)者開(kāi)放,后者可通過(guò)“gpt?5.3?chat?latest”訪(fǎng)問(wèn)。OpenAI 也再次重申幻覺(jué)降低的具體數據區間,明確 5.2 版將在 6 月 3 日退場(chǎng),而 GPT?5.3 Thinking 和 Pro 的發(fā)布時(shí)間則仍待后續公告,多語(yǔ)言語(yǔ)氣自然度的提升被列為正在推進(jìn)中的長(cháng)期任務(wù)。

OpenAI 推出 GPT?5.3 Instant:幻覺(jué)率最高下降26.8% 更少說(shuō)教語(yǔ)氣 09:33:55
三星Galaxy S26重磅發(fā)布:首發(fā)“代理型AI”,邁入自主運行新紀元 11:48:52
電商AI視頻解法升級 美圖設計室將接入Seedance 2.0 11:39:02
一句話(huà)即可自由生成,阿里通義語(yǔ)音雙模型發(fā)布 11:23:00
Windows 11 將迎來(lái)音頻功能升級 共享設備時(shí)體驗進(jìn)一步完善 11:18:59
華為、微軟、亞馬遜等八家公司為創(chuàng )始成員,React 進(jìn)入基金會(huì )時(shí)代 10:53:35