Table of Contents
DeepSeek AI 是什麼:從初學者到精通者

- AI + 國內 + 免費 + 開源 + 強大
DeepSeek 是一家專注於通用人工智慧(AGI)的中國科技公司,重點開發和應用大型模型。DeepSeek-R1 是其開源推理模型,擅長處理複雜任務,並且可以免費商業使用。DeepSeek 從入門到精通(清華大學)PDF 下載
DeepSeek 能做什麼?
文本生成
- 結構化生成: 表格、清單(例如,時間表、菜譜)
- 文件撰寫: 程式碼註釋、文檔
- 創意寫作: 文章、故事、詩歌、營銷文案、社交媒體內容、劇本等
- 摘要與改寫: 長文本摘要(論文、報告)、文本簡化、多語言翻譯和本地化
自然語言理解和分析
- 知識推理: 邏輯問題解決(數學、常識推理)、因果分析(事件相關性)
- 語義分析: 情感分析(評論、反饋)、意圖識別(客戶服務、用戶查詢)、實體提取(名字、地點、事件)
- 文本分類: 主題標籤(例如,新聞分類)、垃圾內容檢測
程式設計與代碼相關任務
- 代碼生成與補全: 代碼片段(Python、JavaScript)、帶註釋的自動補全
- 代碼調試: 錯誤分析與修復建議、性能優化建議
- 技術文檔: API 文檔、代碼庫解釋和示例生成
常規繪圖
- (未明確提及,但通過一般能力暗示)
如何使用 DeepSeek?
從初學者到精通者:當每個人都能使用 AI 時,你如何能更好地、更有效地使用它?
推理模型
- 示例: DeepSeek-R1、GPT-3 在邏輯推理、數學推理和實時問題解決方面表現出色。
推理模型是在傳統大型語言模型的基礎上增強推理、邏輯分析和決策能力的模型。它們通常結合了強化學習、神經符號推理和元學習等額外技術,以加強其推理和解決問題的能力。非推理模型適合大多數任務。通用模型通常專注於語言生成、上下文理解和自然語言處理,而不強調深度推理能力。這些模型通常通過大量的文本數據訓練來掌握語言模式,並能生成適當的內容,但它們缺乏推理模型的複雜推理和決策能力。
維度比較
維度 | 推理模型 | 通用模型 |
---|---|---|
優勢 | 數學推導、邏輯分析、代碼生成、複雜問題分解 | 文本生成、創意寫作、多輪對話、開放性問題 |
弱點 | 發散性任務(例如,詩歌創作) | 需要嚴格邏輯鏈的任務(例如,數學證明) |
性能本質 | 專注於高邏輯密度的任務 | 在高多樣性的任務中表現出色 |
能力判斷 | 不是普遍更強,但在其訓練目標領域顯著更好 | 在一般場景中更靈活,但需要提示工程來補償能力 |
示例模型
- GPT-3、GPT-4(OpenAI)、BERT(Google): 主要用於語言生成、語言理解、文本分類、翻譯等。
快速思考與慢速思考
- 快速反應模型(例如,ChatGPT-4): 快速響應,計算成本低,通過大量的數據訓練進行概率預測。
- 慢速思考模型(例如,OpenAI-1): 響應慢,計算成本高,通過鏈式思考推理來逐步解決問題。
- 決策制定: 快速反應模型依賴預設的算法和規則,而慢速思考模型可以根據實時分析進行自主決策。
- 創造力: 快速反應模型僅限於模式識別和優化,而慢速思考模型可以產生新的想法和解決方案。
- 人機互動: 快速反應模型遵循預設的腳本,難以應對人類情感和意圖,而慢速思考模型可以更自然地互動並理解複雜的情感和意圖。
- 問題解決: 快速反應模型擅長結構化和明確定義的問題,而慢速思考模型可以處理多維度和非結構化問題,提供創造性解決方案。
- 倫理問題: 快速反應模型作為受控工具,幾乎沒有倫理問題,而慢速思考模型引發了關於自主性和控制的討論。
如果你熱衷於人工智慧領域並且正在準備 AWS 或 Microsoft 認證考試,SPOTO 為你準備了全面且實用的學習材料。無論你是準備 AWS 的機器學習認證(MLA-C01)、人工智慧實踐者認證(AIF-C01),還是 Microsoft 的人工智慧相關考試(AI-900、AI-102),我提供的認證材料將幫助你高效學習並增加通過考試的機會。點擊下面的鏈接,獲取最新的考試大綱和詳細的學習指南,幫助你通過考試並在人工智慧行業達到新的高度:
- AWS MLA-C01 學習材料(點擊此處)
- AWS AIF-C01 學習材料(點擊此處)
- AWS MLS-C01 學習材料(點擊此處)
- Microsoft AI-900 學習材料(點擊此處)
- Microsoft AI-102 學習材料(點擊此處)
通過這些認證,你將不僅提升自己的技能,還能在工作場所中脱颖而出,並打開更多機會。趕快行動起來,掌握人工智慧的未來!
CoT 鏈式思考
CoT 鏈式思考的出現將大型模型分為兩類:“概率預測(快速反應)”模型和“鏈式思考(慢速思考)”模型。前者適合快速反饋和即時任務,而後者通過推理解決複雜問題。了解它們的區別有助於選擇適合任務的模型,以獲得最佳結果。
提示策略差異
- 推理模型: 提示應該簡潔,直接聚焦於任務目標和要求(因為推理邏輯已經內化)。避免逐步指導,因為這可能會限制模型的能力。
- 通用模型: 提示需要明確指導推理步驟(例如,通過 CoT 提示),否則模型可能會跳過關鍵邏輯。依賴提示工程來補償能力不足。
關鍵原則
- 模型選擇: 根據任務類型選擇,而不是模型的流行度(例如,推理模型適用於數學任務,通用模型適用於創意任務)。
- 提示設計:
- 推理模型: 使用簡潔的指令,關注目標,並相信模型內化的推理能力。(“只說你想要的內容。”)
- 通用模型: 使用結構化和補償性指導。(“補充缺失的部分。”)
- 避免陷阱:
- 不要使用啟發式提示(例如,角色扮演)與推理模型,因為它可能會干擾其邏輯主線。
- 不要過度信任通用模型(例如,直接詢問複雜推理問題);相反,逐步驗證結果。
從“給出指令”到“表達需求”
策略類型
策略類型 | 定義與目標 | 適用場景 | 示例(推理模型) | 優點與風險 | |
---|---|---|---|---|---|
指令驅動 | 直接提供清晰的步驟或格式要求 | 簡單任務,快速執行 | “用 Python 寫一個快速排序函數並添加註釋。” | ✅ 精確且高效的結果 | ✕ 限制模型的優化空間 |
需求導向 | 描述問題背景和目標,讓模型規劃解決方案路徑 | 複雜問題,模型的自主推理 | “通過分析當前瓶頸並提出 3 個解決方案來優化用戶登錄流程。” | ✅ 激發模型的深度推理 | ✕ 需要明確定義需求邊界 |
混合模式 | 將問題描述與關鍵約束結合 | 平衡靈活性和可控性 | “為杭州設計一個 3 天的旅行計劃,包括西湖和靈隱寺,預算為 2000 元。” | ✅ 平衡目標和細節 | ✕ 避免過度約束 |
啟發式提問 | 通過提問(例如,“為什麼”、“如何”)引導模型積極思考 | 探索性問題,模型的解釋邏輯 | “為什麼選擇梯度下降來解決這個優化問題?與其他算法進行比較。” | ✅ 觸發模型的自我解釋能力 | ✕ 可能偏離核心目標 |
任務需求與提示策略
任務類型 | 適用模型 | 提示重點 | 示例(有效提示) | 避免的提示 |
---|---|---|---|---|
數學證明 | 推理模型 | 直接提問,不進行逐步指導 | “證明畢達哥拉斯定理” | 多餘的分解(例如,“首先畫一個圖,然後列出公式”) |
創意寫作 | 推理模型 | 鼓勵發散思維,設置角色/風格 | “用海明威的風格寫一個冒險故事” | 過度約束邏輯(例如,“按時間順序列出步驟”) |
代碼生成 | 推理模型 | 簡潔的需求,信任模型邏輯 | “在 Python 中實現快速排序” | 逐步指導(例如,“首先編寫遞歸函數”) |
多輪對話 | 通用模型 | 自然互動,不進行結構化指導 | “你怎麼看待人工智慧的未來?” | 強制邏輯鏈(例如,“用三個重點回答”) |
邏輯分析 | 推理模型 | 直接提出複雜問題 | “分析電車難題中的功利主義和義務論衝突” | 添加主觀指導(例如,“你認為哪個更好?”) |
通用模型 | 通用模型 | 分解問題,逐步提問 | “首先解釋電車難題,然後比較這兩種道德觀點” | 一次性提問複雜邏輯 |
如何向 AI 表達需求
需求類型 | 特點 | 需求表達公式 | 推理模型適應策略 | 通用模型適應策略 |
---|---|---|---|---|
決策制定 | 需要權衡選項、評估風險、選擇最佳解決方案 | 目標 + 選項 + 評估標準 | 請求邏輯推導和定量分析 | 直接建議,依賴模型的經驗 |
分析性 | 需要深入理解數據/信息,發現模式或因果關係 | 問題 + 數據/信息 + 分析方法 | 觸發因果鏈推導和假設驗證 | 表面總結或分類 |
創造性 | 需要生成新穎內容(文本/設計/解決方案) | 主題 + 風格/約束 + 創新方向 | 結合邏輯框架生成結構化創造力 | 自由聯想,依賴示例指導 |
驗證性 | 需要檢查邏輯一致性、數據可靠性或解決方案可行性 | 結論/解決方案 + 驗證方法 + 風险點 | 獨立設計驗證路徑並識別矛盾 | 簡單確認,缺乏深入推導 |
執行性 | 需要完成特定操作(代碼/計算/流程) | 任務 + 步驟約束 + 輸出格式 | 自主優化步驟,平衡效率和正確性 | 嚴格遵循指令,不進行自主優化 |
提示示例
決策制定需求:“有兩種選項可以降低物流成本:① 建立區域倉庫(初始投資高,長期成本低)② 與第三方合作(按需支付,靈活性高)請使用 ROI 計算模型比較 5 年內的總成本並推薦最佳解決方案。”驗證需求:“這是一篇論文的結論:‘神經網絡模型 A 優於傳統方法 B。’請驗證:① 實驗數據是否支持這一結論;② 檢查對照組設置是否存在偏差;③ 重新計算 p 值並確定其顯著性。”分析性需求:“分析過去三年新能源汽車的銷售數據(附帶 CSV 文件),並解釋:① 增長趨勢與政策之間的相關性;② 使用 ARIMA 模型預測 2025 年的市場份額並解釋參數選擇的依據。”執行性需求:“將以下 C 語言代碼轉換為 Python,要求如下:① 保持相同的时间复杂度;② 使用 numpy 优化数组操作;③ 输出完整的代码及时间测试用例。”创造性需求:“设计一款针对独居老人安全问题的智能家居产品,结合传感器网络和 AI 早期预警。提供三种不同技术路线的原型草图及说明。”验证性需求:“以下是某篇论文的结论:‘神经网络模型 A 优于传统方法 B。’请验证:① 实验数据是否支持该结论;② 检查对照组设置是否存在偏差;③ 重新计算 p 值并确定其显著性。”
我們是否仍需學習提示?
提示 是用戶輸入到 AI 系統中的指令或信息,用以指導它生成特定的輸出或執行特定的任務。簡單來說,提示就是我們用來與 AI“交談”的語言。它可以是一個簡單的問題、詳細的指令或複雜的任務描述。提示由三個基本元素組成:
- 指令(Instruction): 提示的核心,明確告訴 AI 要執行什麼任務。
- 上下文(Context): 提供背景信息,幫助 AI 更好地理解和執行任務。
- 期望(Expectation): 明確或隱含地表達對 AI 輸出的要求和期望。
提示的類型
- 指令性提示: 直接告訴 AI 要執行什麼任務。
- 問答式提示: 向 AI 提問,期望得到相應的答案。
- 角色扮演提示: 要求 AI 扮演特定角色並模擬特定情境。
- 創意性提示: 引導 AI 進行創意寫作或內容生成。
- 分析性提示: 要求 AI 分析並推理給定的信息。
- 多模態提示: 結合文本、圖像和其他形式的輸入。
提示的本質
特點 | 描述 | 示例 |
---|---|---|
溝通橋樑 | 連接人類意圖與 AI 理解 | “將以下內容翻譯成法語:Hello, world” |
上下文提供者 | 為 AI 提供必要的背景信息 | “假設你是一位 19 世紀的歷史學家,評論拿破崙的崛起” |
任務定義者 | 明確指定 AI 需要完成的任務 | “為一篇關於氣候變化的文章寫一個 200 字的引言” |
輸出塑形者 | 影響 AI 輸出的形式和內容 | “用簡單的語言解釋量子力學,就像對一個 10 歲的孩子說話一樣” |
AI 能力引導者 | 引導 AI 使用特定的能力或技能 | “運用你的創意寫作能力,寫一個關於時間旅行的短故事” |
文章來源:
團隊:于梦龙,
博士后清华大学新闻与传播学院新媒体研究中心,元宇宙文化实验室
Comments