Andrej Karpathy's Intro to Large Language Models

> 2025/2 大神有出更完整的新版 https://www.youtube.com/watch?v=dWr1eTeK6p4 影片: https://www.youtube.com/watch?v=zjkBMFhNj_g 投影片: https://drive.google.com/file/d/1pxx_ZI7O-Nwl7ZLNk5hI3WzAsTLwvNU7/view 有人整理的 Reading List: https://blog.oxen.ai/reading-list-for-andrej-karpathys-intro-to-large-language-models-video/ 網友寫的筆記: https://labs.botsnova.com/2023/11/26/%e9%97%9c%e6%96%bc-andrej-karpathy-%e7%9a%84-intro-to-large-language-models-%e7%9a%84%e4%b8%80%e4%ba%9b%e7%ad%86%e8%a8%98/ * 開頭用 llama 2 70b 模型就是參數檔案+ c code 舉例，並且講了這是一種有損壓縮 * 用 NN 來預測下一個 token 機率 * 會有幻覺，無法 100%確定 * LLM 是經驗主義 * 介紹模型預訓練和微調 * LLM Scaling Laws * 只要參數量和訓練量增加，就可以保證一定提升 LLM 效能 * 算法改進只是 bonus * 介紹用外部工具: Bing search, 計算機, code interpreter 畫圖, DELL-E * 介紹 GPT-4V 轉 website * 多模態 multi-modal 和 Audio (以下是比較新知的內容) * 未來發展1 * 人有 System 1 跟 System 2 * 但是 LLM currently only have a System 1 * 希望透過 convert time to accuracy 達成 think，例如 ToT * 目標是之後可以跟 GPT 直接講說: 這件事情你可以慢慢想30分鐘沒關係 * 做出一個思考時間跟準確性成正比的系統 * 未來發展2 * Self-improvement * 參考自 AlphaGo * 第一階段是模仿人類專家，但無法超越人類 * 第二階段是 self-improvement (reward = win the game)，可以超越人類 * LLM 目前是第一階段，第二階段會是? * 困難是於沒有通用的 reward function * 在狹窄領域是有可能可行，還是未解之謎 * 未來發展3 * Custom LLMs * custom GPTs 是最新嘗試，但只有改 prompt, RAG 等 * 之後可以想像會有微調可以客製 * LLM OS 的比喻 * LLM 不是 chatbot，而是一個 OS 發展 * 也有區分開源跟不開源 OS * LLM Security * Jailbreak * 可用角色扮演越獄 * powerful 又難以阻擋 * claude 用 base64 再問一次，也可以越獄 * 這是因為拒絕訓練大多是用英文訓練的.... * Universal Transferable Suffix * 圖片也可以藏有害 noise * Prompt injection * 可以藏看不見的 injection 文字 * Bard 和 Apps Script 攻擊案例 * Data poisoning / Backdoor attacks * 藏在預訓練資料裡面，有特定的觸發詞可以破壞模型 * 安全性還有很多議題....