CCNA 200-301

CCNP Enterprise

CCNP Security

CCIE Enterprise Lab

CCIE Security Lab

CCNP Service Provider

CCNP Data Center

CCNP Collaboration

CCIE DC Lab

DeepSeek AI 是什麼:從初學者到精通者

DeepSeek AI
  • AI + 國內 + 免費 + 開源 + 強大

DeepSeek 是一家專注於通用人工智慧(AGI)的中國科技公司,重點開發和應用大型模型。DeepSeek-R1 是其開源推理模型,擅長處理複雜任務,並且可以免費商業使用。DeepSeek 從入門到精通(清華大學)PDF 下載

DeepSeek 能做什麼?

文本生成

  • 結構化生成: 表格、清單(例如,時間表、菜譜)
  • 文件撰寫: 程式碼註釋、文檔
  • 創意寫作: 文章、故事、詩歌、營銷文案、社交媒體內容、劇本等
  • 摘要與改寫: 長文本摘要(論文、報告)、文本簡化、多語言翻譯和本地化

自然語言理解和分析

  • 知識推理: 邏輯問題解決(數學、常識推理)、因果分析(事件相關性)
  • 語義分析: 情感分析(評論、反饋)、意圖識別(客戶服務、用戶查詢)、實體提取(名字、地點、事件)
  • 文本分類: 主題標籤(例如,新聞分類)、垃圾內容檢測

程式設計與代碼相關任務

  • 代碼生成與補全: 代碼片段(Python、JavaScript)、帶註釋的自動補全
  • 代碼調試: 錯誤分析與修復建議、性能優化建議
  • 技術文檔: API 文檔、代碼庫解釋和示例生成

常規繪圖

  • (未明確提及,但通過一般能力暗示)

如何使用 DeepSeek?

訪問:https://chat.deepseek.com

從初學者到精通者:當每個人都能使用 AI 時,你如何能更好地、更有效地使用它?

推理模型

  • 示例: DeepSeek-R1、GPT-3 在邏輯推理、數學推理和實時問題解決方面表現出色。

推理模型是在傳統大型語言模型的基礎上增強推理、邏輯分析和決策能力的模型。它們通常結合了強化學習、神經符號推理和元學習等額外技術,以加強其推理和解決問題的能力。非推理模型適合大多數任務。通用模型通常專注於語言生成、上下文理解和自然語言處理,而不強調深度推理能力。這些模型通常通過大量的文本數據訓練來掌握語言模式,並能生成適當的內容,但它們缺乏推理模型的複雜推理和決策能力。

維度比較

維度推理模型通用模型
優勢數學推導、邏輯分析、代碼生成、複雜問題分解文本生成、創意寫作、多輪對話、開放性問題
弱點發散性任務(例如,詩歌創作)需要嚴格邏輯鏈的任務(例如,數學證明)
性能本質專注於高邏輯密度的任務在高多樣性的任務中表現出色
能力判斷不是普遍更強,但在其訓練目標領域顯著更好在一般場景中更靈活,但需要提示工程來補償能力

示例模型

  • GPT-3、GPT-4(OpenAI)、BERT(Google): 主要用於語言生成、語言理解、文本分類、翻譯等。

快速思考與慢速思考

  • 快速反應模型(例如,ChatGPT-4): 快速響應,計算成本低,通過大量的數據訓練進行概率預測。
  • 慢速思考模型(例如,OpenAI-1): 響應慢,計算成本高,通過鏈式思考推理來逐步解決問題。
  • 決策制定: 快速反應模型依賴預設的算法和規則,而慢速思考模型可以根據實時分析進行自主決策。
  • 創造力: 快速反應模型僅限於模式識別和優化,而慢速思考模型可以產生新的想法和解決方案。
  • 人機互動: 快速反應模型遵循預設的腳本,難以應對人類情感和意圖,而慢速思考模型可以更自然地互動並理解複雜的情感和意圖。
  • 問題解決: 快速反應模型擅長結構化和明確定義的問題,而慢速思考模型可以處理多維度和非結構化問題,提供創造性解決方案。
  • 倫理問題: 快速反應模型作為受控工具,幾乎沒有倫理問題,而慢速思考模型引發了關於自主性和控制的討論。

如果你熱衷於人工智慧領域並且正在準備 AWS 或 Microsoft 認證考試,SPOTO 為你準備了全面且實用的學習材料。無論你是準備 AWS 的機器學習認證(MLA-C01)、人工智慧實踐者認證(AIF-C01),還是 Microsoft 的人工智慧相關考試(AI-900、AI-102),我提供的認證材料將幫助你高效學習並增加通過考試的機會。點擊下面的鏈接,獲取最新的考試大綱和詳細的學習指南,幫助你通過考試並在人工智慧行業達到新的高度:

通過這些認證,你將不僅提升自己的技能,還能在工作場所中脱颖而出,並打開更多機會。趕快行動起來,掌握人工智慧的未來!

CoT 鏈式思考

CoT 鏈式思考的出現將大型模型分為兩類:“概率預測(快速反應)”模型和“鏈式思考(慢速思考)”模型。前者適合快速反饋和即時任務,而後者通過推理解決複雜問題。了解它們的區別有助於選擇適合任務的模型,以獲得最佳結果。

提示策略差異

  • 推理模型: 提示應該簡潔,直接聚焦於任務目標和要求(因為推理邏輯已經內化)。避免逐步指導,因為這可能會限制模型的能力。
  • 通用模型: 提示需要明確指導推理步驟(例如,通過 CoT 提示),否則模型可能會跳過關鍵邏輯。依賴提示工程來補償能力不足。

關鍵原則

  1. 模型選擇: 根據任務類型選擇,而不是模型的流行度(例如,推理模型適用於數學任務,通用模型適用於創意任務)。
  2. 提示設計:
    • 推理模型: 使用簡潔的指令,關注目標,並相信模型內化的推理能力。(“只說你想要的內容。”)
    • 通用模型: 使用結構化和補償性指導。(“補充缺失的部分。”)
  3. 避免陷阱:
    • 不要使用啟發式提示(例如,角色扮演)與推理模型,因為它可能會干擾其邏輯主線。
    • 不要過度信任通用模型(例如,直接詢問複雜推理問題);相反,逐步驗證結果。

從“給出指令”到“表達需求”

策略類型

策略類型定義與目標適用場景示例(推理模型)優點與風險
指令驅動直接提供清晰的步驟或格式要求簡單任務,快速執行“用 Python 寫一個快速排序函數並添加註釋。”✅ 精確且高效的結果✕ 限制模型的優化空間
需求導向描述問題背景和目標,讓模型規劃解決方案路徑複雜問題,模型的自主推理“通過分析當前瓶頸並提出 3 個解決方案來優化用戶登錄流程。”✅ 激發模型的深度推理✕ 需要明確定義需求邊界
混合模式將問題描述與關鍵約束結合平衡靈活性和可控性“為杭州設計一個 3 天的旅行計劃,包括西湖和靈隱寺,預算為 2000 元。”✅ 平衡目標和細節✕ 避免過度約束
啟發式提問通過提問(例如,“為什麼”、“如何”)引導模型積極思考探索性問題,模型的解釋邏輯“為什麼選擇梯度下降來解決這個優化問題?與其他算法進行比較。”✅ 觸發模型的自我解釋能力✕ 可能偏離核心目標

任務需求與提示策略

任務類型適用模型提示重點示例(有效提示)避免的提示
數學證明推理模型直接提問,不進行逐步指導“證明畢達哥拉斯定理”多餘的分解(例如,“首先畫一個圖,然後列出公式”)
創意寫作推理模型鼓勵發散思維,設置角色/風格“用海明威的風格寫一個冒險故事”過度約束邏輯(例如,“按時間順序列出步驟”)
代碼生成推理模型簡潔的需求,信任模型邏輯“在 Python 中實現快速排序”逐步指導(例如,“首先編寫遞歸函數”)
多輪對話通用模型自然互動,不進行結構化指導“你怎麼看待人工智慧的未來?”強制邏輯鏈(例如,“用三個重點回答”)
邏輯分析推理模型直接提出複雜問題“分析電車難題中的功利主義和義務論衝突”添加主觀指導(例如,“你認為哪個更好?”)
通用模型通用模型分解問題,逐步提問“首先解釋電車難題,然後比較這兩種道德觀點”一次性提問複雜邏輯

如何向 AI 表達需求

需求類型特點需求表達公式推理模型適應策略通用模型適應策略
決策制定需要權衡選項、評估風險、選擇最佳解決方案目標 + 選項 + 評估標準請求邏輯推導和定量分析直接建議,依賴模型的經驗
分析性需要深入理解數據/信息,發現模式或因果關係問題 + 數據/信息 + 分析方法觸發因果鏈推導和假設驗證表面總結或分類
創造性需要生成新穎內容(文本/設計/解決方案)主題 + 風格/約束 + 創新方向結合邏輯框架生成結構化創造力自由聯想,依賴示例指導
驗證性需要檢查邏輯一致性、數據可靠性或解決方案可行性結論/解決方案 + 驗證方法 + 風险點獨立設計驗證路徑並識別矛盾簡單確認,缺乏深入推導
執行性需要完成特定操作(代碼/計算/流程)任務 + 步驟約束 + 輸出格式自主優化步驟,平衡效率和正確性嚴格遵循指令,不進行自主優化

提示示例

決策制定需求:“有兩種選項可以降低物流成本:① 建立區域倉庫(初始投資高,長期成本低)② 與第三方合作(按需支付,靈活性高)請使用 ROI 計算模型比較 5 年內的總成本並推薦最佳解決方案。”驗證需求:“這是一篇論文的結論:‘神經網絡模型 A 優於傳統方法 B。’請驗證:① 實驗數據是否支持這一結論;② 檢查對照組設置是否存在偏差;③ 重新計算 p 值並確定其顯著性。”分析性需求:“分析過去三年新能源汽車的銷售數據(附帶 CSV 文件),並解釋:① 增長趨勢與政策之間的相關性;② 使用 ARIMA 模型預測 2025 年的市場份額並解釋參數選擇的依據。”執行性需求:“將以下 C 語言代碼轉換為 Python,要求如下:① 保持相同的时间复杂度;② 使用 numpy 优化数组操作;③ 输出完整的代码及时间测试用例。”创造性需求:“设计一款针对独居老人安全问题的智能家居产品,结合传感器网络和 AI 早期预警。提供三种不同技术路线的原型草图及说明。”验证性需求:“以下是某篇论文的结论:‘神经网络模型 A 优于传统方法 B。’请验证:① 实验数据是否支持该结论;② 检查对照组设置是否存在偏差;③ 重新计算 p 值并确定其显著性。”


我們是否仍需學習提示?

提示 是用戶輸入到 AI 系統中的指令或信息,用以指導它生成特定的輸出或執行特定的任務。簡單來說,提示就是我們用來與 AI“交談”的語言。它可以是一個簡單的問題、詳細的指令或複雜的任務描述。提示由三個基本元素組成:

  • 指令(Instruction): 提示的核心,明確告訴 AI 要執行什麼任務。
  • 上下文(Context): 提供背景信息,幫助 AI 更好地理解和執行任務。
  • 期望(Expectation): 明確或隱含地表達對 AI 輸出的要求和期望。

提示的類型

  • 指令性提示: 直接告訴 AI 要執行什麼任務。
  • 問答式提示: 向 AI 提問,期望得到相應的答案。
  • 角色扮演提示: 要求 AI 扮演特定角色並模擬特定情境。
  • 創意性提示: 引導 AI 進行創意寫作或內容生成。
  • 分析性提示: 要求 AI 分析並推理給定的信息。
  • 多模態提示: 結合文本、圖像和其他形式的輸入。

提示的本質

特點描述示例
溝通橋樑連接人類意圖與 AI 理解“將以下內容翻譯成法語:Hello, world”
上下文提供者為 AI 提供必要的背景信息“假設你是一位 19 世紀的歷史學家,評論拿破崙的崛起”
任務定義者明確指定 AI 需要完成的任務“為一篇關於氣候變化的文章寫一個 200 字的引言”
輸出塑形者影響 AI 輸出的形式和內容“用簡單的語言解釋量子力學,就像對一個 10 歲的孩子說話一樣”
AI 能力引導者引導 AI 使用特定的能力或技能“運用你的創意寫作能力,寫一個關於時間旅行的短故事”

文章來源:

團隊:于梦龙,

博士后清华大学新闻与传播学院新媒体研究中心,元宇宙文化实验室

Please follow and like us:
Last modified: February 13, 2025

Author

Comments

Write a Reply or Comment

Your email address will not be published.