丝袜美腿美女被狂躁动态图片|麻豆视频免费在线观看|欧美日韩精品一区二区|天天爽亚洲中文字幕|久久久久九九精品影院|久久一区二区三区四区|人妻内射一区二区在线视频

<style id="ok17p"></style>

<style id="ok17p"></style>

<td id="ok17p"><tr id="ok17p"></tr></td>

丝袜美腿美女被狂躁动态图片|麻豆视频免费在线观看|欧美日韩精品一区二区|天天爽亚洲中文字幕|久久久久九九精品影院|久久一区二区三区四区|人妻内射一区二区在线视频

<style id="95rtn"></style>

<form id="95rtn"></form>

<td id="95rtn"></td>

<td id="95rtn"></td>

<style id="95rtn"></style>

Internet Develppment

互聯(lián)網(wǎng)開(kāi)發(fā)& 推廣服務(wù)提供商

首頁(yè) 微信與小程序網(wǎng)站開(kāi)發(fā) 客戶(hù)案例新聞中心聯(lián)系我們

我們擅長(cháng)商業(yè)策略與用戶(hù)體驗的完美結合。

歡迎瀏覽我們的案例。

首頁(yè) > 新聞中心 > 新聞動(dòng)態(tài) > 正文

DeepSeek下一代技術(shù)提前曝光，梁文鋒署名論文獲ACL2025最佳論文

發(fā)布時(shí)間：2025-07-31 09:26:37來(lái)源：量子位

　　夢(mèng)晨發(fā)自凹非寺

　　量子位 | 公眾號 QbitAI

　　在A(yíng)CL 2025的頒獎典禮上，由DeepSeek梁文鋒作為通訊作者、與北京大學(xué)等聯(lián)合發(fā)表的論文榮獲最佳論文獎。

　　這次ACL 2025規?？涨?，總投稿量達到8360篇，相較于去年的4407篇幾乎翻倍，競爭異常激烈。

　　

　　簡(jiǎn)單來(lái)說(shuō)，他們提出的原生稀疏注意力(NSA)機制，通過(guò)算法與硬件的協(xié)同優(yōu)化，直接把長(cháng)文本處理速度提升了11倍。更厲害的是，性能不僅沒(méi)降反而還超越了傳統的全注意力模型。

　　一作袁境陽(yáng)在會(huì )上發(fā)表演講，透露這項技術(shù)可以把上下文長(cháng)度擴展到1百萬(wàn)tokens，將被應用到下一個(gè)前沿模型中。

　　結合論文發(fā)表于DeepSeek-R1推出之后，實(shí)驗設置中也提到使用了DeepSeek-R1的蒸餾數據來(lái)微調了新的模型。

　　大家紛紛猜測，這項技術(shù)將被用于下一代DeepSeek-V4以及DeepSeek-R2。

　　

　　給注意力機制瘦身，速度狂飆11倍

　　長(cháng)久以來(lái)，大語(yǔ)言模型處理長(cháng)文本就像是戴著(zhù)鐐銬跳舞。傳統的全注意力機制計算復雜度隨序列長(cháng)度呈平方級增長(cháng)，處理64k長(cháng)度的文本時(shí)，注意力計算竟然要占到總延遲的70-80%。

　　這篇論文的解決思路很巧妙：既然不是所有詞之間的關(guān)系都同等重要，為什么不讓模型學(xué)會(huì )”抓重點(diǎn)”呢?

　　NSA采用了一種動(dòng)態(tài)分層的稀疏策略，通過(guò)三條并行的注意力分支協(xié)同工作：

　　壓縮注意力，負責捕捉粗粒度的全局信息模式，就像快速瀏覽全文抓住大意;

　　選擇性注意力，則專(zhuān)注于序列中最重要的詞塊，相當于精讀關(guān)鍵段落;

　　滑動(dòng)注意力，負責獲取局部的上下文信息，確保細節不丟失。

　　

　　這種設計最精妙的地方在于，它不是簡(jiǎn)單地丟棄信息，而是通過(guò)精心設計的算法平衡了計算密度。

　　更重要的是，整個(gè)架構針對現代GPU硬件進(jìn)行了深度優(yōu)化，實(shí)現了端到端的原生可訓練模式。

　　

　　在實(shí)際測試中，處理64k長(cháng)度序列時(shí)，NSA在解碼、前向傳播和反向傳播的全生命周期中都展現出驚人的速度優(yōu)勢。

　　解碼階段速度提升11.6倍，前向傳播提升9倍，反向傳播也有6倍的加速，無(wú)論是模型推理還是訓練，都能獲得實(shí)實(shí)在在的效率提升。

　　

　　不僅快還更準，長(cháng)文本處理迎來(lái)新突破

　　速度快只是NSA的一面，更讓人驚訝的是它在各項基準測試中的表現。

　　在通用基準測試中，采用NSA預訓練的27B參數模型在9個(gè)評測指標中有7個(gè)超越了全注意力基線(xiàn)。特別是在推理相關(guān)的基準測試上，DROP提升了0.042，GSM8K提升了0.034，顯示出稀疏注意力在強制模型聚焦關(guān)鍵信息方面的獨特優(yōu)勢。

　　

　　長(cháng)文本處理能力的測試結果更是亮眼。在64k上下文的”大海撈針”測試中，NSA在所有位置都實(shí)現了完美的檢索準確率。在LongBench基準測試上，NSA取得了0.469的平均分，不僅超越了全注意力基線(xiàn)(+0.032)，更是大幅領(lǐng)先其他稀疏注意力方法。

　　

　　特別值得一提的是，在需要復雜推理的多跳問(wèn)答任務(wù)上，NSA相比全注意力分別提升了0.087(HPQ)和0.051(2Wiki);在代碼理解任務(wù)(LCC)上提升了0.069;在段落檢索任務(wù)(PassR-en)上提升了0.075。

　　

　　研究團隊還進(jìn)行了一項有趣的實(shí)驗：

　　他們用DeepSeek-R1的數學(xué)推理數據對模型進(jìn)行微調，然后在美國數學(xué)邀請賽(AIME 24)上測試。

　　結果顯示，NSA-R在8k上下文設置下的準確率達到0.121，而全注意力模型只有0.046;即使在16k上下文下，NSA-R仍然保持0.146的準確率，遠超全注意力的0.092。

　　

　　這些結果充分證明了NSA不是通過(guò)犧牲性能來(lái)?yè)Q取速度，而是真正實(shí)現了效率和能力的雙贏(yíng)。

　　Three More Thing

　　這次總共評選出4篇最佳論文，另外三篇包括：

　　北大團隊的《Language Models Resist Alignment: Evidence From Data Compression》

　　研究了大型語(yǔ)言模型的“彈性”，指模型經(jīng)過(guò)對齊訓練(讓模型符合人類(lèi)價(jià)值觀(guān)、減少有害輸出)后，很容易因為后續的微調而變回預訓練時(shí)的狀態(tài)，就像彈簧被拉伸后會(huì )反彈一樣。

　　這意味著(zhù)現有的對齊方法可能只是表面上改變了模型，不夠穩固。未來(lái)需要更有效的對齊技術(shù)，才能讓模型真正穩定地符合人類(lèi)需求，尤其是在開(kāi)源模型中，要避免惡意微調輕易破壞安全機制。

　　

　　斯坦福團隊的《Fairness through Difference Awareness: Measuring Desired Group Discrimination in LLMs》

　　研究了大模型“公平性” 上的一個(gè)新視角 “差異感知”。簡(jiǎn)單來(lái)說(shuō)，就是模型應該在合適的場(chǎng)景下對不同群體做出區分，而不是一味地一視同仁。

　　研究發(fā)現那些在傳統公平性測試中表現好的模型，在 “差異感知” 上得分并不高;模型能力越強(比如 MMLU 分數越高)，情境感知能力越好，但差異感知能力未必提升;現有的 “去偏見(jiàn)” 方法(比如提示模型 “保持無(wú)偏見(jiàn)”)反而會(huì )讓模型更無(wú)視差異，甚至把正確答案改錯。

　　

　　亥姆霍茲信息安全中心等團隊的《A Theory of Response Sampling in LLMs: Part Descriptive and Part Prescriptive》。

　　這篇論文指出大模型生成回答時(shí)的采樣機制與人類(lèi)決策類(lèi)似，包含描述性成分(反映概念的統計常態(tài))和規定性成分(隱含的概念理想狀態(tài))。

　　研究通過(guò)實(shí)驗驗證，無(wú)論是新創(chuàng )概念還是現有概念(涵蓋 10 個(gè)領(lǐng)域的 500 個(gè)概念)，LLMs 生成的樣本都會(huì )偏離統計平均值，向其認為的 “理想值” 偏移，且這種現象在 15 種不同模型中均顯著(zhù)存在。案例研究顯示，這種偏向可能導致醫療等領(lǐng)域的有偏決策，引發(fā)倫理問(wèn)題。

　　

　　DeepSeek論文地址：

　　https://arxiv.org/abs/2502.11089

　　參考鏈接：

　　[1]https://x.com/aclmeeting/status/1950572483637067786

　　[2]https://x.com/casper_hansen_/status/1950649481617342803

商業(yè)利益超越宏大使命，...

最后一頁(yè)

熱點(diǎn)推薦

最新資訊

? 2018 河北碼上網(wǎng)絡(luò )科技有限公司版權所有冀ICP備18021892號-1

? 2018 河北碼上科技有限公司版權所有.

聯(lián)系電話(huà)

手機18931099002
官方微信
返回頂部

感谢您访问我们的网站，您可能还对以下资源感兴趣：

丝袜美腿美女被狂躁动态图片|麻豆视频免费在线观看|欧美日韩精品一区二区|天天爽亚洲中文字幕|久久久久九九精品影院|久久一区二区三区四区|人妻内射一区二区在线视频

<style id="ok17p"></style>

<style id="ok17p"></style>

<td id="ok17p"><tr id="ok17p"></tr></td>

国产成人一区二区三区| 国产A级毛片久久久久久精品| 99精品视频在线观看免费| 中文字幕一区二区三区四季| 国产女主播精品大秀系列| 一本一道色欲综合网中文字幕| 国色天香影院| 中文字幕无码日本欧美大片| 亚洲综合另类小说色区一| 国产高潮一区在线流白浆| 国模冰冰洗澡私拍3| 中文国产一级视频在线观看| 一区二区三区鲁丝不卡| 日韩精品高分影片| 无码人妻精品一区二区三区不卡| 国产福利一区二区精品秒拍| 无码免费一区二区三区免费播放| 国产V亚洲V天堂无码网站| 亚洲综合图色40p| 四虎影视久久久免费| 亚洲国产成人精品无码区蜜柚| 久久亚洲美日韩精品无码一区二区| 丰满人妻熟妇乱又伦精品| 777片理伦片在线观看| 极品美女囗交视频| 国产一区二区三区乱码| 公和我做好爽添厨房在线观看| 丰满少妇被猛男猛烈进入久久| 一级a片免费看刺激高潮视频| 桃花色综合影院| 日产精品一线二线三线在线观看| 亚洲国产综合精品| 国产无av码在线观看| 一级乱理中文字幕| 最新国产精品一区二区久久| 亚洲国产在a无码在线一级| 国产日本一区二区三区四区五区| 国产精品久久久久久三级| 99国产精品99久久久久久粉嫩| 成人午夜国产内射主播| 日韩视频在线免费观看| 99久久免费视频6| 国产91精品久久久久| 亚洲综合精品在线第一页| 亚洲?∨区无码字幕中文色| 国产成人a片在线播放| 国产ⅴ亚洲ⅴ天堂无码久久| 久久99久久99精品免费看小说| 在线中文字幕一区| 精品综合一区二区在线观看| 黑人巨大精品欧美| 亚洲精品第一国产综合亚AV| 色婷婷欧美在线播放内射| www国产亚洲精品| 亚洲日韩国产新品| 99精品国产免费久久久久久下载| 亚洲一区二区日韩精品| 国产精品99久久99久久久动漫| 欧美人与动牲猛交xxxxbbbb| av大全免费在线观看| 国产亚洲欧美日韩三区电影| 亚洲激情国产一区二区在线观看| 欧美日韩中文亚洲v在线播放| 国产成人无码AV一区二区在线观看| 天堂а在线地址8最新版| 亚洲综合国内精品自拍/| 亚洲人妖一区二区| 成人午夜精品网站在线观看| 亚洲五月天色色天堂| 国产欧美日韩综合精品二区| 99久久国产精品免费| 色婷a√久久无码久久精品| 国产亚洲精品无码不卡| 亚洲av成人影视综合网| 国产末成年女av片| 久久精品丝袜高跟鞋| 中文字幕专区高清在线观看| 亚洲欧美一区二区三区视频免费| 国产真实女人一级毛片| 国产日韩亚洲欧美精品专区| 欧美激情一区二区三区四区| 在线观看一区二区精品视频| 亚洲一级无码一区二区一| 人人妻人人澡人人爽人人DVD| 中文字幕亚洲情99在线| 中文在线最新版天堂| 国产91专区| 亚洲精品无码久久性| 国产一级在线黄色视频网站| 国产精品人妻一区二区三区四| 欧美日韩亚洲区久久综合| 国产一区二区精品久久| 一本大道熟女人妻中文字幕在线| 午夜福利精品视频区| a人片视频在线观看免费| 在线天堂www在线| 一级黄色毛片视频免费观看| 亚洲中文字幕无码AV在线| 亚洲精品久久久中文字幕痴女| 中文字幕精品无码一区二区| 亚洲美女高潮视频免费| 91精品国产91久久久久久黑人| 精品久久久久久一区二区里番| 欧美熟女一区二区久久| 91精品福利一区二区三| 国产精品日产一区在线观看| 中文字幕2019国语免费播放| 狠狠cao2020高清视频| 国产一级真人做受视频| 欧美综合自拍亚洲综合图| 亚洲AV区无码字幕中文色| 日本免费高清一本视频| 浴室里强摁做开腿呻吟的漫画免费| 亚洲av无码专区在线播放| 久久99国产精品久久| 国产18尤物在线观看| 日本vitafusion孕妇| 欧美日韩三级免费电影| 无码制服丝袜人妻OL在线视频| 日韩一级a片黄片纯片免费观看| 一女多男同时进6根同时进行| 一级毛片免费播放器| 在线观看亚洲精品福利片| 亚洲综合另类小说色区一| 欧美乱码精品一区二区三区| 亚洲区视频在线观看| 亚洲人成网站综合| 性高朝久久久久久久| 丰满少妇内射一区| 综合欧美亚洲日本| 丰满少妇高潮惨叫久久久一| 国产精品美女久久久久久久| 精品国产免费人成网站| 中文字幕熟妇人妻在线视频| 亚洲中文字幕永远在线| 日韩欧美视频一区成人| 最新亚洲国产有精品| 免费人成视频在线播放视频| 亚洲人成网站在线播放影院在线| 91久久爽久久爽爽久久片| 国产精品爽爽va在线观看无码| 亚洲人成人影院在线观看| 亚洲成a v人片在线观看| 综合欧美日韩中文字幕| 性色AV一二三天美传媒| 亚洲精品卡2卡3卡4卡5卡区| 亚洲精品国偷自产久色| 亚洲国产精品久久久久爰子伦| 无码专区九九视频一区| 日本一区免费在线观看| 国产伦人伦偷精品视频| 日韩免费爱插摸免费视频网站| 国产香蕉视频在线播放| 亚洲欧美日韩高清专区一区| 黄色一级大片在线免费看产| 亚欧成人毛片一区二区三区四区| 国产精品嫩草影院久久久| 久久久久久久久蜜桃| 亚洲中字幕永久在线观看| 又大又粗又硬又刺激又爽视频| 亚洲综合一区二区| 国产色无码精品视频免费| 一天时间就想通了……全文免费| av办公室丝袜高跟秘书的呻吟|

<input id="se3ap"></input>

<dl id="se3ap"><bdo id="se3ap"></bdo></dl>