DeepSeek模型V4 望下月登場 程式碼生成任務 表現超GPT系列

熱度0票  瀏覽0次 時間:2026年1月13日 08:55
據悉DeepSeek大模型V4輸出的答案邏輯更嚴謹、推理過程更清晰,反映其推理能力較前代更可靠。(路透資料圖片)
據悉DeepSeek大模型V4輸出的答案邏輯更嚴謹、推理過程更清晰,反映其推理能力較前代更可靠。(路透資料圖片)

科技媒體The Information引述消息報道,內地人工智能(AI)初創深度求索(DeepSeek)有望於今年2月中旬、農曆新年前後,正式推出新一代旗艦級大模型V4。市場普遍預期,V4將在編程能力、超長代碼處理及推理可靠性等個核心維度實現顯著突破,或再度成為全球AI競爭格局的重要變數。

適用工程級開發場景

兩名直接知情人士透露,V4為2024年12月發布V3模型的迭代版本,據DeepSeek內部初步基準測試顯示,V4在程式碼生成任務上的表現,已超越包括OpenAI GPT系列及Anthropic Claude在內的多個主流模型,尤其適用於複雜軟體項目與工程級開發場景。

消息人士表示,V4在處理與解析極長程式碼提示詞方面取得技術突破,對專業開發者具備顯著應用價值。除編程能力外,V4在訓練全流程中對數據模式的理解能力亦獲優化,且在多輪訓練後未出現明顯效能衰減問題,這意味模型在規模擴張及長時間使用下,仍能維持穩定表現。另有知情人士形容,V4輸出的答案邏輯更嚴謹、推理過程更清晰,反映其推理能力較前代更為可靠。

國產模型部分範疇可「領跑」

內媒引述開源證券報道,2025年初DeepSeek「橫空出世」,不僅令國產大模型獲國際關注,亦在開源社區形成深遠影響,並帶動一波AI科技投資行情。隨着模型持續迭代,V4發布有望成為新一輪行業催化劑。

中郵證券亦指出,中國大模型產業正由單點技術追趕,邁向系統化布局與生態構建階段,在算法、算力、數據及政策多重推動下,國產模型有望於2026年前後實現由「並跑」到部分領域「領跑」的跨越。

DeepSeek早前發表由行政總裁梁文鋒聯合署名的研究論文,提出全新訓練架構,可在不按比例增加AI晶片投入的前提下,支持更大參數規模模型的構建,被視為其持續壓低成本、提升效率的重要技術路線,亦為V4的推出奠定基礎。

DeepSeek於2024年底推出V3及後續版本,已在多項基準測試中取得亮眼成績;而R1模型的發布,更因採用「先思考、後作答」的推理型架構,並以相對低廉的訓練成本達致高性能表現,震動科技界與金融界,令DeepSeek迅速躍升至全球AI舞台。

頂:0 踩:0
對本文中的事件或人物打分:
當前平均分:0 (0次打分)
對本篇資訊內容的質量打分:
當前平均分:0 (0次打分)
上一篇 下一篇