我們擅長(cháng)商業(yè)策略與用戶(hù)體驗的完美結合。
歡迎瀏覽我們的案例。
3 月 4 日消息,谷歌昨日(3 月 3 日)發(fā)布博文,宣布推出輕量級 AI 模型 Gemini 3.1 Flash-Lite,聲稱(chēng)是其速度最快、最具成本效益的 Gemini 3 系列模型。
開(kāi)發(fā)者目前可通過(guò) Google AI Studio 中的 Gemini API 獲取預覽版,企業(yè)級用戶(hù)也能在 Vertex AI 平臺上同步體驗。
價(jià)格方面,為大幅降低 AI 應用門(mén)檻,谷歌為該模型制定了極具競爭力的價(jià)格:每百萬(wàn)輸入 Tokens 收費 0.25 美元,每百萬(wàn)輸出 Tokens 為 1.50 美元。
在低售價(jià)的同時(shí),Gemini 3.1 Flash-Lite 在性能方面實(shí)現大幅跨越。權威評測平臺 Artificial Analysis 的數據顯示,與前代 2.5 Flash 相比,新模型的首字響應速度(TTFT)暴漲 2.5 倍,整體輸出速度同步提升 45%。這種極低延遲特性,讓其成為構建實(shí)時(shí)響應體驗的理想之選。

在各項核心能力測試中,3.1 Flash-Lite 展現出越級挑戰的實(shí)力。該模型不僅在 Arena.ai 排行榜上斬獲了 1432 分的 Elo 得分,更在多模態(tài)理解與邏輯推理測試中全面領(lǐng)先同級競品。
具體而言,它在 GPQA Diamond 測試中得分率高達 86.9%,在 MMMU Pro 測試中達到 76.8%,甚至在多項指標上超越了體積更大的上一代 Gemini 2.5 Flash 模型。IT之家附上相關(guān)數據如下:

除了硬核的性能指標,3.1 Flash-Lite 還在 AI Studio 和 Vertex AI 中標配了創(chuàng )新的“思考層級(thinking levels)”功能。
這一機制支持開(kāi)發(fā)者靈活控制模型在執行任務(wù)時(shí)的“思考深度”:
在處理海量翻譯或內容審核等對成本極度敏感的基礎任務(wù)時(shí),開(kāi)發(fā)者可調低思考深度以追求極致效率;
而在面臨生成用戶(hù)界面、構建數據看板或復雜邏輯模擬等高難度任務(wù)時(shí),則可調高思考層級,激發(fā)模型更深度的推理能力。
Latitude、Cartwheel 以及 Whering 等早期測試企業(yè)目前已率先將 3.1 Flash-Lite 部署于復雜的業(yè)務(wù)場(chǎng)景中。測試團隊反饋稱(chēng),該模型不僅具備卓越的處理效率和邏輯推理能力,還能以媲美大型模型的精準度處理復雜輸入指令。


谷歌發(fā)布Gemini 3.1 Flash-Lite:首字響應提速2.5倍 09:47:53
高通發(fā)布首款支持Wi?Fi 8的芯片 承諾2029年推動(dòng)6G網(wǎng)絡(luò )商用 09:42:34
Anthropic推免費記憶與導入工具 09:36:44
OpenAI 推出 GPT?5.3 Instant:幻覺(jué)率最高下降26.8% 更少說(shuō)教語(yǔ)氣 09:33:55
三星Galaxy S26重磅發(fā)布:首發(fā)“代理型AI”,邁入自主運行新紀元 11:48:52
電商AI視頻解法升級 美圖設計室將接入Seedance 2.0 11:39:02