你的位置：香港易事泊 Hong Kong e-Services Provider >> 新聞資訊 >> 科技世界 >> 詳細內容在線投稿

DeepSeek發布NSA 訓練推理加速藉本機硬件原生成本降性能不減

熱度537票瀏覽25次時間：2025年2月19日 09:11

信報財經新聞

更新時間 2025年2月19日週三上午7:43 [GMT+8]

中美在AI人工智能領域的角力愈趨激烈，在美國富商馬斯克旗下初創xAI發布新一代聊天機械人「Grok 3」後，內媒報道，近期鋒芒畢露的內地AI初創DeepSeek亦不甘示弱，宣布推出用於超快速長文本（long-context）訓練與推理的「原生稀疏注意力」（Native Sparse Attention，簡稱NSA）。

報道指出，DeepSeek官方昨在海外社交平台X，發表題為〈原生稀疏注意力：硬體對齊且可原生訓練的稀疏注意力機制〉的論文，DeepSeek創始人梁文鋒亦是作者之一，內容提及NSA是一種與硬件一致、且本機可訓練的稀疏注意力機制。

據介紹，NSA針對現代硬體進行優化設計，通過三大組件的配合，能加速推理過程，同時減低預訓練成本，且不犧牲性能；NSA在通用基準測試、長文本任務與基於指令的推理方面，與「完全注意力」模型的表現旗鼓相當，甚至更佳；NSA為提高效率同時保持模型能力，提供一個有前景的方向。

福田區引入70名「員工」AI審公文

DeepSeek熱潮席捲各行各業，深圳市福田區政府近日正式引入首批共70名「AI數智員工」，參與公文處理、民生服務、應急管理與招商引資等多項關鍵領域的政務工作，藉此提升行政效率；據知，該批「AI數智員工」建基於DeepSeek R1技術，可做到公文格式修正準確率超過95%、審核時間縮短90%，錯誤率控制在5%以內。

AI大行其道，但如何避免過分依賴，開始成為社會關注點；內媒報道，剛過去的寒假，不少學生借助AI完成功課，「學生使用DeepSeek完成寒假作業」成為熱議話題，多地老師均發現，學生繳交的功課「AI含量偏高」，有學生的功課在假期前後有明顯差異；有教育界人士建議，先讓孩子獨自完成功課，被某個問題難到才使用AI協助。

深圳大學夥騰訊雲開課程

另根據深圳大學消息，深圳大學大數據系統運算技術國家工程實驗室，近日與騰訊雲達成合作，共同推出基於DeepSeek的人工智能通識課程，學生在今個學期即可選讀；課程內容涵蓋人工智能的基礎知識、技術原理，以及DeepSeek在人工智能內容生成（AIGC），自然語言處理、電腦視覺、智慧推薦等領域的實際應用案例。

頂:31 踩:28

[支持最多的] 慕尼黑狂欢派对大批“兔女郎”上阵(图)
[反對最多的] 十三届华表奖优秀故事片提名：超强台风

對本文中的事件或人物打分:
-5-5 -4-4 -3-3 -2-2 -1-1 00 11 22 33 44 55	當前平均分：-0.57 （151次打分）
[給-5最多的] 2012年教育财政投入占GDP4％列财政支出首位 [給-4最多的] 《斗牛》入围威尼斯电影节黄渤为戏受伤一 [給-3最多的] 倡議三查優化精準扶貧鄺美雲鼓勵中港學生 [給-2最多的] 內地新冠肺炎確診逼近7.5萬宗湖北逾2000人 [給-1最多的] 香港易事泊（HKeSP）——“易联（eLink）”项目 [給0最多的] 天娱传媒“杀”陈楚生给谁看 [給1最多的] 外資連續9月淨增持中國債加速吸人幣資產 [給2最多的] 慕尼黑狂欢派对大批“兔女郎”上阵(图) [給3最多的] 预防乳癌韩国一线女星惊艳造型秀(图) [給4最多的] 十三届华表奖优秀合拍片提名：长江七号 [給5最多的] 恒指瀉377失最後防線踩入熊市中央放水無
對本篇資訊內容的質量打分:
-5-5 -4-4 -3-3 -2-2 -1-1 00 11 22 33 44 55	當前平均分：-0.68 （157次打分）
[給-5最多的] 丈夫：希望李英爱叫我哥哥但她总叫我总裁先 [給-4最多的] 邓加宣布辞去巴西主帅拒绝大罗之人含恨离 [給-3最多的] 重庆A级景区接待游客超千万 [給-2最多的] Facebook与Skype合作推视频聊天功能 [給-1最多的] 恒指瀉377失最後防線踩入熊市中央放水無 [給0最多的] 决赛惨败无碍马琳出彩四连亚打不倒奥运会 [給1最多的] 恒指瀉377失最後防線踩入熊市中央放水無 [給2最多的] 《斗牛》入围威尼斯电影节黄渤为戏受伤一 [給3最多的] 井上雄彥圓夢日本男籃進軍巴黎奧運 [給4最多的] 網上熱話｜屯門惡人刀削麵終結業網民：為兩蚊 [給5最多的] 台湾含塑化剂饮料销往厦门东莞数量约五六