DeepSeek核心技術(shù)原理和本地部署微調(diào)實操課程

聯(lián)系我們：
13382173255（Karen鄭老師）

學員背景| Course Background

參加對象：管理者

授課形式：內(nèi)訓

授課天數(shù)：2 天

課程背景| Course Background

隨著人工智能技術(shù)的快速發(fā)展，智能助手（如DeepSeek-V3）在多模態(tài)理解、個性化交互、知識推理等領(lǐng)域的應用日益廣泛。DeepSeek-V3作為深度求索公司推出的第三代智能助手，憑借其先進的核心技術(shù)（如大規(guī)模預訓練、多模態(tài)理解、上下文感知等），在智能客服、內(nèi)容創(chuàng)作、教育、醫(yī)療等領(lǐng)域展現(xiàn)了強大的潛力。

然而，要將DeepSeek-V3的能力充分發(fā)揮并應用于實際業(yè)務場景，不僅需要深入理解其核心技術(shù)原理，還需要掌握本地部署和微調(diào)的方法，以滿足特定領(lǐng)域或企業(yè)的定制化需求。為此，本課程旨在幫助學員系統(tǒng)學習DeepSeek-V3的核心技術(shù)原理，并通過實操掌握本地部署和微調(diào)的技能，從而提升在實際項目中的應用能力。

課程收益| Program Benefits

1. 深刻理解DeepSeek-V3的核心技術(shù)原理

· 掌握DeepSeek-V3的架構(gòu)設計、多模態(tài)理解、上下文感知、知識圖譜等核心技術(shù)。

· 掌握大規(guī)模預訓練模型（如Transformer）的工作原理及其在DeepSeek-V3中的應用。

2. 掌握DeepSeek-V3的本地部署方法

· 學習如何搭建適合DeepSeek-V3運行的本地環(huán)境（包括硬件配置、依賴庫安裝等）。

· 掌握DeepSeek-V3的本地部署流程，包括模型加載、服務啟動和接口調(diào)用。

· 掌握如何優(yōu)化部署性能，以支持高并發(fā)和低延遲的應用場景。

3. 學會DeepSeek-V3的微調(diào)與定制化

· 掌握如何利用領(lǐng)域數(shù)據(jù)對DeepSeek-V3進行微調(diào)，以提升其在特定任務中的表現(xiàn)。

· 學習微調(diào)過程中的關(guān)鍵技術(shù)，包括數(shù)據(jù)預處理、模型訓練、參數(shù)調(diào)優(yōu)等。

4. 提升實際項目中的應用能力

· 通過實戰(zhàn)案例，學習如何將DeepSeek-V3應用于智能客服、內(nèi)容生成、知識問答等場景。

課程大綱| Course Outline

第一天課程：DeepSeek-V3/R1核心技術(shù)架構(gòu)和訓練過程

上午課程

第一部分 DeepSeek-V3的架構(gòu)創(chuàng)新：訓練GPU和成本均低，但效果卓越

1.1 V3風靡海內(nèi)外的關(guān)鍵因素：訓練成本極低、引領(lǐng)前沿創(chuàng)新

1.1.1 V3訓練成本：所用的GPU訓練資源僅為Llama 3.1 405B的差不多1/14

1.1.2 在國內(nèi)也能引領(lǐng)世界級前沿

1.2 模型架構(gòu)：MLA、負載均衡的MoE、Multi-Token預測

1.2.1 多頭潛在注意力

1.2.2. 無輔助損失的負載平衡 DeepSeekMoE

1.2.3 多token預測：Multi-Token Prediction顯著加快模型的解碼速度

第二部分 DeepSeek-V3基礎(chǔ)設施層面的創(chuàng)新：FP8 訓練等

2.1 訓練框架(含GPU的內(nèi)部結(jié)構(gòu)示意圖)

2.1.1 雙管道DualPipe與計算-通信重疊

2.1.2 跨節(jié)點全對全通信的高效實現(xiàn)：通過PXT連接CUDA和底層GPU硬件

2.1.3. 極致內(nèi)存節(jié)省與最小開銷

2.2 FP8訓練：雖算的快但精度不夠，故需提高精度

2.2.1 混合精度框架

2.2.2. 通過量化和乘法提高精度

2.2.2 低精度存儲和通信：降低內(nèi)存和通信開銷

2.3 推理與部署

2.3.1 預填充

2.3.2 解碼

2.4 硬件設計建議

下午課程

第三部分 DeepSeek-V3的預訓練與后訓練

3.1 預訓練

3.1.1 數(shù)據(jù)構(gòu)建：提高數(shù)學、編程、多語言樣本，最終14.8T語料

3.1.2 超參數(shù)

3.1.3 長上下文擴展

3.1.4 評估與討論

3.2 訓練后處理：透露了大半后來引爆全球的R1正式版訓練流程

3.2.1 監(jiān)督微調(diào)

3.2.2 強化學習：涉及獎勵模型和GRPO

3.2.3 評估與討論：關(guān)于DeepSeek-R1提煉與多token預測

第四部分 DeepSeek R1：如何通過純RL訓練大模型的推理能力

4.1 提出背景與相關(guān)工作

4.1.1 R1-Zero的提出背景：無需人類數(shù)據(jù)，從零實現(xiàn)自我迭代

4.1.2 R1的提出背景：解決Zero可讀性差等問題

4.2 DeepSeek-R1-Zero：規(guī)則驅(qū)動的大規(guī)模RL訓練，無冷啟動、無SFT

4.2.1 RL算法GRPO：不需要critic

4.2.2 規(guī)則獎勵建模(準確率獎勵 + 格式獎勵)：不用訓練專門的獎勵模型RM

4.2.3 訓練模板：通過prompt讓Zero啟動深度思考的推理模式

4.2.4 Zero的性能、自我進化過程和頓悟時刻

4.3 DeepSeek-R1：先冷啟動數(shù)據(jù)SFT 再RL，之后再SFT 再RL

4.3.1 階段一冷啟動(主要關(guān)注推理)：通過R1-Zero生成數(shù)千條長CoT數(shù)據(jù)

4.3.2 階段二面向推理的GRPO RL：類似Zero的規(guī)則獎勵，但增加語言一致性獎勵

4.3.3 階段三 V3上的的兩輪SFT(結(jié)合rejection sampling)：涉及80w通用層面的推理和非推理數(shù)據(jù)

4.3.4 階段四所有場景的RL：提高有用性和無害性，且混合規(guī)則獎勵和偏好獎勵

4.4 蒸餾：賦予小模型推理能力

4.5 一些經(jīng)驗總結(jié)：成功和失敗的經(jīng)驗分析總結(jié)

第二天課程：DeepSeek本地部署和微調(diào)案例實操

上午課程

第五部分本地部署準備工作：各個版本、推理框架、硬件資源

5.1 DeepSeek-R1的多個版本：加上2個原裝671B的，總計8個參數(shù)版本

5.2 主流的大模型推理框架：分為PC端和Android端

5.3 不同參數(shù)的模型所要求的硬件

5.4 蒸餾版和滿血版的兩類部署

第六部分通過Ollama、vLLM本地部署DeepSeek-R1蒸餾版：支持聯(lián)網(wǎng)搜索及知識庫問答

6.1 基于Ollama和各類插件構(gòu)建智能對話：終端、open-webui(支持聯(lián)網(wǎng))、Chatbox

6.1.1 Ollama下的終端命令行交互

6.1.2 Ollama下的open-webui交互：基于docker安裝，且支持聯(lián)網(wǎng)搜索

6.1.3 基于Ollama + ChatBox部署deepseek-r1:7b

6.2 基于Ollama和Page Assist/AnythingLLM構(gòu)建本地知識庫問答系統(tǒng)

6.2.1 基于Ollama + Page Assist搭建本地知識庫問答系統(tǒng)：且支持聯(lián)網(wǎng)搜索

6.2.2 基于Ollama + AnythingLLM搭建本地知識庫問答

6.3 通過vLLM推理deepseek-r1

6.3.1 基于vLLM的命令行交互——R1-Distill-Llama-8B

6.3.2 基于vllm + open WebUi 部署r1 7b

6.4 本地手機端部署DeepSeek-R1蒸餾Llama/Qwen后的版本

下午課程

第七部分無蒸餾前提下本地部署R1 or R1-Zero 671B滿血版

7.1 折中路徑：無蒸餾但量化部署Deepseek-R1 671B滿血版

7.1.1 本地CPU上運行 Deepseek-R1 的完整的硬件 + 軟件設置

7.1.2 GPU上跑無蒸餾但量化的Deepseek-R1 671B滿血版

7.2 企業(yè)級部署：無蒸餾不量化部署Deepseek-R1 671B滿血版

專利和文獻：

深度學習國際發(fā)明專利

1) 基于深度學習的圖像檢索方法及裝置，專利公開公告號：CN107368614A。專利類型：發(fā)明公布。發(fā)明人：周紅偉;李凱;任偉;李慶;郭奇杰;周楊;劉川郁

2) Simulation model and droplet ejection performance of a thermal-bubble microejector，Hongwei Zhou，A.M.Gué，Sensors and Actuators B: Chemical Volume 145，Issue 1，4 March 2010，Pages 311-319

3)Simulation Bubble Nucleation and Bubble Growth of a Thermal Bubble Microejector,Hongwei Zhou，A.M.Gué，Excerpt from the Proceedings of the COMSOL Conference 2009 Mila

講師背景| Introduction to lecturers

了解更多

珀菲特顧問|周紅偉老師

講師簡介 / About the Program Leader

ChatGPT與大模型實戰(zhàn)專家—周紅偉老師

（阿里大模型算法專家，大數(shù)據(jù)和AI實戰(zhàn)專家）

【背景介紹】

? 現(xiàn)任云宇宙科技CEO

? 前馬上消費金融風控負責人

? 前阿里人工智能算法專家

? 前豬八戒大數(shù)據(jù)科學家

? 重慶市大數(shù)據(jù)科學家

? 富民銀行--大數(shù)據(jù)專家

? 人工智能科學家

? 法國科學院數(shù)據(jù)算法博士

? 發(fā)起《重慶市金融風險防范實驗室》任風控總監(jiān)

【實戰(zhàn)經(jīng)驗】

周紅偉先生是重慶市大數(shù)據(jù)和人工智能專家，阿里大模型算法專家。周老師2009年畢業(yè)于法國科學院LAAS實驗室，榮獲多項人工智能算法國際發(fā)明專利。近10年人工智能算法、大數(shù)據(jù)智能決策實戰(zhàn)經(jīng)驗，近兩年大模型部署和微調(diào)經(jīng)驗。先后任職互聯(lián)網(wǎng)獨角獸大數(shù)據(jù)總監(jiān)、技術(shù)總監(jiān)。

畢業(yè)后專注于深度學習，大數(shù)據(jù)，云計算，大模型。現(xiàn)任職于云宇宙科技有限公司，搭建大模型微調(diào)平臺，深度學習算法平臺，基于大模型的智能決策平臺。應用大模型賦能金融科技業(yè)務，大模型應用于客戶營銷、客戶業(yè)務咨詢和實時語音質(zhì)檢業(yè)務。

在港宇科技開發(fā)了基于深度學習的車輛視頻跟蹤，車牌識別，優(yōu)于?？低暤耐惍a(chǎn)品，為華為公司的OEM供貨商。曾任職豬八戒大數(shù)據(jù)科學家，伴隨著豬八戒網(wǎng)的閃電擴張，從百億估值向千億估值的征程中，領(lǐng)導研發(fā)了國內(nèi)第一個基于大數(shù)據(jù)，深度神經(jīng)網(wǎng)絡的商標搜索系統(tǒng)。作為馬上消費金融風控負責人，領(lǐng)導研發(fā)了基于共享經(jīng)濟平臺的大數(shù)據(jù)金融風控系統(tǒng)。曾就職于商才數(shù)字科技公司，任技術(shù)總監(jiān)，設計和領(lǐng)帶開發(fā)了綜合電商交易平臺，點餐外賣平臺，數(shù)據(jù)中臺，服務于電商、點餐外賣業(yè)務，帶動了公司快速的互聯(lián)網(wǎng)生態(tài)化發(fā)展。

周老師一直專注于企業(yè)在大模型、人工智能，大數(shù)據(jù)，云計算的業(yè)務場景落地應用。大模型背景下，如何應對移動互聯(lián)網(wǎng)，互聯(lián)網(wǎng)生態(tài)系統(tǒng)搭建，大數(shù)據(jù)，人工智能的挑戰(zhàn)和企業(yè)應對策略，商業(yè)模式的變更。企業(yè)如何在大模型時代，搭建人工智能企業(yè)架構(gòu)，博得大數(shù)據(jù)、大模型紅利。大模型時代共享經(jīng)濟的思維變革，人工智能金融探秘，互聯(lián)網(wǎng)領(lǐng)域的投資挖掘。

培訓課程 / Training courses

1、《大模型的應用、微調(diào)和部署案例實踐》

2、《大模型微調(diào)、部署、行業(yè)應用和接口開發(fā)》

3、《算力網(wǎng)絡：算力網(wǎng)絡技術(shù)原理及落地實踐》

4、《ChatGPT與AIGC生成式人工智能操作實戰(zhàn)》

5、《大模型賦能企業(yè)辦公降本提效案例應用實操》

6、《人工智能下一個時代：ChatGPT的技術(shù)實現(xiàn)原理、行業(yè)實踐以及商業(yè)變現(xiàn)途徑》

7、《大模型在金融行業(yè)的應用案例實踐》

8、《大模型在通信行業(yè)的應用實踐》

7、《下一代人工智能：隱私計算和可信人工智能》

8、《互聯(lián)網(wǎng)(消費金融)企業(yè)的AI大數(shù)據(jù)應用》

9、《AI世界模擬器：Sora視頻生成模型的技術(shù)實現(xiàn)原理、行業(yè)實踐以及商業(yè)變現(xiàn)途徑》

10、《大模型技術(shù)體系架構(gòu)和算法案例實操》

11、《互聯(lián)網(wǎng)金融的大數(shù)據(jù)風控》

代表性客戶 / PART OF TRAINED COMPANIES INCLUDED BUT NOT LIMITED TO

互聯(lián)網(wǎng)：蘋果、微軟、三星、華為、阿里、網(wǎng)易、百度、騰訊、字節(jié)跳動、馬上金融；

金融：匯豐銀行、花旗銀行、工商銀行、招商銀行、法國興業(yè)銀行、中國農(nóng)業(yè)銀行、建設銀行、中國銀行、富民銀行、微眾銀行、中信銀行；

通信：中國移動研究院、上海移動研究院、北京移動、上海移動、江蘇移動、杭州移動、杭州移動研究院、黑龍江移動、四川移動、中國電信、北京電信研究院、中國聯(lián)通、北京聯(lián)通研究總院、四川聯(lián)通、杭州聯(lián)通、中國鐵塔、中移物聯(lián)網(wǎng)；

政府：國家網(wǎng)絡信息安全中心、河南省金融監(jiān)控總局、北京市政府、重慶市政府、杭州市政府、陜西省政府；

能源：中國石油、中國石化、中國海洋石油；

電力：中國電力、中國電力科技

工業(yè)：寶武集團、上海汽車、中建八局

服務流程

Service Procedure

提交需求
溝通診斷
項目調(diào)研
方案設計
達成共識
項目實施
持續(xù)跟蹤
效果評估

服務優(yōu)勢

Service Advantages

對行業(yè)特性的深刻理解

我們擁有幾百家各類企業(yè)的項目咨詢基礎(chǔ)、多行業(yè)數(shù)據(jù)庫、多年的行業(yè)經(jīng)驗，并對企業(yè)進行深度研究和剖析，總結(jié)出一系列深入的觀點和經(jīng)驗。
豐富的案例庫及落地方案

我們的咨詢方案的設計過程秉承“知行合一”的理念，既具備理論知識，又重視項目的實操性。經(jīng)過多年的經(jīng)驗，我們積累了豐富的案例庫，涉及18個領(lǐng)域，近千個案例，并將案例與咨詢項目完美結(jié)合。
經(jīng)驗深厚的咨詢團隊

我們的咨詢團隊分布于各大領(lǐng)域，擁有多年的業(yè)內(nèi)從業(yè)經(jīng)驗，具備豐富的企業(yè)管理實操經(jīng)驗。在定制咨詢方案前，我們會為客戶匹配多位業(yè)內(nèi)咨詢師，供客戶進行比對選擇，根據(jù)客戶需求及問題，定制化地設計咨詢方案，確保項目的順利進行。

關(guān)于珀菲特顧問

ABOUT PERFECT CONSULTANT

我們是？人才培養(yǎng)與智能制造解決方案提供商。

We are? Talent training and intelligent manufacturing solutions provider.

我們做什么？承接組織績效提升與人才學習發(fā)展業(yè)務。

What we do ?Provide organizational performance improvement and talent learning development business.

服務的客戶：世界五百強企業(yè)、合資工廠、國有企業(yè)、快速發(fā)展的民營企業(yè)、行業(yè)領(lǐng)頭企業(yè)。

Customers:Each year, we serves more than 1000 enterprises (including fortune 500 enterprises, joint venture factories, state-owned enterprises, rapidly developing private enterprises and industry-leading enterprises).

2011年成立

10年更懂你
6000⁺

中大型企業(yè)共同選擇
600000⁺

累計培訓學員
1500⁺

現(xiàn)有公開課
10000⁺

現(xiàn)有內(nèi)訓課
800⁺

現(xiàn)有在線課程
20⁺

輻射城市

線下業(yè)務

OFFLINE BUSINESS

內(nèi)訓課

高層團隊引導工作坊

中層管理內(nèi)訓

基層管理內(nèi)訓
項目咨詢

人才梯隊建設咨詢項目

工廠運營咨詢項目

TTT內(nèi)訓師咨詢項目
公開課

領(lǐng)導力公開課

精益智造公開課

個人效能公開課

視頻資訊

Video Information

【見證企業(yè)成長每一步】
AI效能提升 × HR實戰(zhàn)干貨 × 領(lǐng)導力精要，前沿管理智慧每周更新，
關(guān)注視頻號獲取全場景管理解決方案，讓卓越觸手可及！

企業(yè)視頻號

官網(wǎng)電話：400-008-4600；手機號：13382173255（Karen鄭老師）；網(wǎng)站：www.perfectpx.com

培訓的客戶涵蓋多個行業(yè)的知名企業(yè)

PART OF TRAINED COMPANIES INCLUDED BUT NOT LIMITED TO

開課地點

開課時間

熱門搜索

梯度領(lǐng)導力解決方案

企業(yè)內(nèi)訓師解決方案

一線班組長解決方案

智能工廠解決方案

新員工培養(yǎng)解決方案

企業(yè)內(nèi)訓課關(guān)鍵詞

第一天課程：DeepSeek-V3/R1核心技術(shù)架構(gòu)和訓練過程

第一部分 DeepSeek-V3的架構(gòu)創(chuàng)新：訓練GPU和成本均低，但效果卓越

第二天課程：DeepSeek本地部署和微調(diào)案例實操

珀菲特顧問|周紅偉老師

講師簡介 / About the Program Leader

培訓課程 / Training courses

代表性客戶 / PART OF TRAINED COMPANIES INCLUDED BUT NOT LIMITED TO

服務流程

服務優(yōu)勢

對行業(yè)特性的深刻理解

豐富的案例庫及落地方案

經(jīng)驗深厚的咨詢團隊

關(guān)于珀菲特顧問

我們是？人才培養(yǎng)與智能制造解決方案提供商。

我們做什么？承接組織績效提升與人才學習發(fā)展業(yè)務。

服務的客戶：世界五百強企業(yè)、合資工廠、國有企業(yè)、快速發(fā)展的民營企業(yè)、行業(yè)領(lǐng)頭企業(yè)。

2011年成立

6000+

600000+

1500+

10000+

800+

20+

線下業(yè)務

內(nèi)訓課

項目咨詢

公開課

視頻資訊

培訓的客戶涵蓋多個行業(yè)的知名企業(yè)

數(shù)字化搭建企業(yè)學習平臺，加速人才培養(yǎng)

解決方案

企業(yè)內(nèi)訓

企業(yè)公開課

企業(yè)在線平臺

400-008-4600

我們是？人才培養(yǎng)與智能制造解決方案提供商。

我們做什么？承接組織績效提升與人才學習發(fā)展業(yè)務。

服務的客戶：世界五百強企業(yè)、合資工廠、國有企業(yè)、快速發(fā)展的民營企業(yè)、行業(yè)領(lǐng)頭企業(yè)。

6000⁺

600000⁺

1500⁺

10000⁺

800⁺

20⁺