國信證券：DeepSeek多層面技術提升訓練效率測試性能領跑開源模型美股 US Stocks Quote - 外圍新聞內容 Golbal News Content

智財迅 (iPhone)

智財迅 (Android)

手機版網頁

美股

基金

外匯、加密貨幣

滬、深港通

港股

納斯達克

恆生指數

道瓊斯

標準普爾

新聞分享

如欲分享新聞，請填寫收件人及閣下之電郵，再按「送出」。*必需填寫

收件者電郵*

請用分號「;」分隔不同電郵地址，例子：a@a.com;b@b.com

閣下之電郵*

分享內容

國信證券：DeepSeek多層面技術提升訓練效率測試性能領跑開源模型

國信證券發表報告表示，中國人工智能公司深度求索(DeepSeek)於去年12月26日上線並開源DeepSeek-V3模型，多項評測超同類開源模型，在重要領域與頂尖閉源模型相當，訓練成本低。模型層採用M...

重設

送出

視窗將於5秒內關閉

新聞首頁 / 所有新聞

回上頁

國信證券：DeepSeek多層面技術提升訓練效率測試性能領跑開源模型

AAAASTOCKS新聞

推薦

50

利好

81

利淡

30

沽空

股價

國信證券發表報告表示，中國人工智能公司深度求索(DeepSeek)於去年12月26日上線並開源DeepSeek-V3模型，多項評測超同類開源模型，在重要領域與頂尖閉源模型相當，訓練成本低。模型層採用MoE架構，經多階段訓練與能力提煉，在知識、代碼、數學推理等測評中領先開源模型。架構層沿用V2架構，引入新技術，如無輔助損失負載均衡策略、MTP提升數據利用率。訓練層通過DualPipe算法和FP8混合精度訓練實現成本控制與效率提升。

推理層先推出R1-Lite模型，後將R1推理能力遷移至V3提升其性能，推理算力包含GB300、博通、marvell等各類asic芯片。2025年1月發布的DeepSeek-R1模型在多測試中超越OpenAI的o1，在數學、編程及多種測試中表現出色。

國信證券指，DeepSeek的MoE較傳統MoE有多方面改進。與傳統MoE架構相比，DeepSeek MoE使用了更細粒度的專家，並將部分專家設置為共享專家，能夠更精確地針對特定的問題提供解決方案。同時，傳統MoE架構採用輔助損失來鼓勵負載平衡，以免不平衡的專家載荷導致計算效率降低，但這可能在某些情況下影響模型性能。DeepSeekMoE引入了無輔助損失的負載平衡策略，在每個專家模型的任務匹配程度評分中添加一個偏置項，用於調整每個專家在決定哪些專家應該處理哪些任務時的負載，同時使用補充序列級輔助損失，以此來優化整個系統的性能和效率。

該行指，為了促進模型的高效訓練，DeepSeek實施了工程優化。首先，模型使用了DualPipe算法，以實現高效的管道並行。與現有方法相比，DualPipe具有更少的管道氣泡(等待數據處理或通信延遲形成的停滯區域)，在模型訓練的前向和後向傳播過程實現了重疊計算和通信，從而提高了整體的訓練效率。其次，DeepSeek引入了FP8混合精度訓練，優化了訓練期間的內存佔用。

DualPipe技術優化通信成本。在大規模分布式訓練系統中，每個計算節點需要頻繁地與其他節點交換信息，導致部分時間在等待數據的傳輸，計算資源不能持續進行數據處理，資源利用率低下。以DeepSeek-V3為例，在模型訓練時跨節點的專家並行性帶來的通信開銷導致計算與通信的比率約為1:1。為了解決這一問題，DeepSeek在單獨的前向和後向塊內部重疊計算和通信，通過採用雙向管道調度，同時從管道的兩端供給數據，使大部分通信可以完全重疊，從而實現通信成本的降低。

本周一(20)日晚，擁有660B參數的超大規模模型DeepSeekR1正式發布。這款模型在數學任務上表現出色，如在AIME2024上獲得79.8%的pass@1得分，略超OpenAI-o1；在MATH-500上得分高達97.3%，與OpenAI-o1相當。編程任務方面，如Codeforces 上獲得2029 Elo評級，超越96.3%的人類參與者。在MMLU、MMLU-Pro和GPQA Diamond等知識基準測試中，DeepSeek R1得分分別為90.8%、84.0%和71.5%，雖略低於OpenAI-o1，但優於其他閉源模型。在最新公布的大模型競技場LM Arena的綜合榜單中，DeepSeek R1排名第三，與o1並列。(wl/k)

AASTOCKS新聞

最HIT熱話(過去2小時)

1

1455

黑天鵝作者：對盲目押注AI股的投資者而言英偉達週一的大跌只是開始

格隆匯新聞

2

1391

AI大地震將擴大美股各方漲勢

鉅亨網新聞

3

1208

〈美股盤前〉ASML提振信心那指走升市場觀察Fed動向

鉅亨網新聞

4

1196

ASML執行長：像是DeepSeek等低成本AI模型只會帶動更多晶片需求

鉅亨網新聞

5

839

美股異動｜台積電漲超1.5% 分析師指DeepSeek對其盈利影響微乎其微

格隆匯新聞

6

820

隔夜美股 | 科技股集體反彈英偉達(NVDA.US)漲近9%

7

813

摩根大通：最大科技股的暴跌不構成信用問題

格隆匯新聞

8

764

《大行》里昂料DeepSeek有助AI應用普及貨幣化利好AI設備公司如小米及瑞聲

9

745

〈美股盤後〉科技股回神輝達飆近9%、那指漲逾2%

鉅亨網新聞

10

705

《美股》AI陰霾略退英偉達成功反彈高收9% 納指全日飆391點

美國經濟數據日誌

公佈日期	指標
暫時沒有相關新聞。

美股網站地圖

阿思達克財經網

美股報價

美股即時報價

即時最近查詢美股

美股圖表分析

美股互動圖表

市場動態

美國預託證券ADR

中國概念股

納斯達克100成份股表現

行業分類表現

最HIT行業統計

經濟數據圖表

分析

美股圖表分析

美股互動圖表

ETF

新聞

美國經濟日誌

外圍經濟數據

支援電郵: support@aastocks.com

阿斯達克網絡信息有限公司 (AASTOCKS.COM LIMITED) 版權所有，不得轉載

免責聲明

閣下明確同意使用本網站／應用程式的風險是由閣下個人承擔。

AASTOCKS.com Ltd、香港交易所資訊服務有限公司、中國投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、其控股公司及／或該等控股公司的任何附屬公司、或其資訊來源及／或其他第三方數據供應商均竭力確保所提供資訊的準確和可靠度，但不能保證其絕對準確和可靠，且亦不會承擔因任何不準確或遺漏而引起的任何損失或損害的責任（不管是否侵權法下的責任或合約責任又或其他責任）。

AASTOCKS.com Ltd、香港交易所資訊服務有限公司、中國投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、其控股公司及／或該等控股公司的任何附屬公司、或其資訊來源及／或其他第三方數據供應商均對資訊不作任何明示或隱含的要約、陳述或保證 (包括但不限於可銷售性及特殊用途合適性的資訊保證) 。

AASTOCKS.com Ltd、香港交易所資訊服務有限公司、中國投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、或其控股公司及／或該等控股公司的任何附屬公司、或其資訊來源及／或其他第三方數據供應商不會就任何原因導致的中斷、不準確、錯誤或遺漏或因此而造成的任何損害賠償（不論直接或間接、相應而生、懲罰性或懲戒性）對任何人承擔責任。

AASTOCKS.com Ltd不負責，亦不承擔任何由於不可抗力的事故或在AASTOCKS.com Ltd不可合理控制的情況下導致的損失或損害，如颱風、暴雨、其他自然災難、政府或有關機構的限制、騷動、戰爭、病毒爆發，網絡故障或電信故障，引致AASTOCKS.com Ltd不能履行協議內的責任或提供服務。

Morningstar 免責聲明：版權所有©2020 Morningstar，Inc。保留所有權利此處包含的資料，數據，分析和意見（“信息”）:（1）包含Morningstar及其內容提供者的專營資料; （2）除特別授權外，不得複製或轉載; （3）不構成投資建議; （4）僅供參考，（5）並未為所載資料的完整性、準確性及時間性作出保證。Morningstar對於閣下使用任何相關資料而作出的任何有關交易決定、傷害及其它損失均不承擔任何責任。請在使用所有資料前作出核實，並且在諮詢專業投資顧問意見前勿作任何投資決定。過往業績並不代表將來表現，任何投資項目的價值及所得收入皆可升可跌。

本網站／應用程式包含的內容和信息乃根據公開資料分析和演釋，該公開資料，乃從相信屬可靠之來源搜集，這些分析和信息並未經獨立核實和AASTOCKS.com Limited並不保證他們的準確性、完整性、實時性或者正確性。

在本網站／應用程式的資料、金融市場數據、報價、圖表、統計數據、匯率、新聞、研究、分析、購買或者出售評分、財金教學及其他資訊僅作參考使用，在根據資訊執行證券或任何交易前，應諮詢獨立專業意見，以核實定價資料或獲取更詳細的市場信息。AASTOCKS.com Limited不應被視為游說任何訂戶或訪客執行任何交易，閣下須為所有跟隨在本網站／應用程式的資料、評論和購買或出售評分執行的交易負責。

AASTOCKS.com Limited之信息服務基於「現況」及「現有」的基礎提供，網站／應用程式的信息和內容如有更改恕不另行通知。AASTOCKS.com Limited有權但無此義務，改善或更正在本網站／應用程式的任何部分之錯誤或疏漏。

用戶在沒有AASTOCKS.com Limited明確的書面同意情況下，不得以任何方式複製、傳播、出售、出版、廣播、公佈、傳遞資訊內容或者利用在本網站／應用程式的信息和內容作商業用途。

投資涉及風險。閣下可自行决定利用本網站的財金教學作學術參考用途，但 AASTOCKS.com Limited不能並不會保證任何在本網站／應用程式現在或未來的購買或出售評論和訊息會否帶來贏利。過往之表現不一定反映未來之表現，AASTOCKS.com Limited不可能作出該保證及用戶不應該作出該假設。

AASTOCKS.com Limited也許連結訂戶或訪客至其有興趣的網站，但AASTOCKS.com Limited只提供此服務給訂戶或訪客並不為此安排負責。

AASTOCKS.com Limited對於任何包含於、經由、連結、下載或從任何與本網站／應用程式有關服務所獲得之資訊、內容或廣告，不聲明或保證其內容之正確性或可靠性。對於閣下透過本網站／應用程式上之廣告、資訊或要約而展示、購買或取得之任何產品、資訊資料，本公司亦不負品質保證之責任。

AATV是AASTOCKS.com Limited旗下的視頻網站平台。

閣下確認：(i) AATV只為提供資訊，並不為了任何交易目的；(ii) AATV節目內容以及其提供的資料並不構成任何AASTOCKS為售賣任何證券作出招攬、提出要約、意見或推薦，或對任何證劵或投資的收益或是否合適提供法律、稅務、會計、或投資意見或服務；及(iii)AATV並非為任何人士或法律實體在其他司法管轄區或國家使用，而在當地可能因該使用或分發而違反當地法律或法規。

AATV中節目內容中的個人意見和觀點僅供參考及討論，亦並不代表AASTOCKS.com Limited的立場。投資者必須按其本身投資目標及財務狀況自行作出投資決定。AASTOCKS.com Limited不對以下任何情況對閣下或任何人直接或間接負責：（i）AATV的不准確性，錯誤或遺漏，包括但不限於報價和財務數據；（ii）AATV中節目傳輸的延遲，錯誤或中斷；（iii）閣下由AATV中節目內容招致任何損失。

我們保留權利不時更改本免責聲明並於本網站／應用程式刊登更新版本。閣下必須定期查閱於本網站／應用程式刊登的資訊，以確保您即時知悉任何有關的改動。如閣下於本免責聲明更新後仍繼續使用本網站／應用程式，即代表閣下同意接受更改後的本免責聲明的約束。

本免責聲明應受中華人民共和國香港特別行政區(「香港」)法律管限。閣下同意接受香港法院的專屬司法管轄權管轄。

本免責聲明的中英原文如有任何岐異，一切以英文原文為準。

更新日期為: 2023年1月6日