> 2025/2 大神有出更完整的新版 https://www.youtube.com/watch?v=dWr1eTeK6p4
影片: https://www.youtube.com/watch?v=zjkBMFhNj_g
投影片: https://drive.google.com/file/d/1pxx_ZI7O-Nwl7ZLNk5hI3WzAsTLwvNU7/view
有人整理的 Reading List: https://blog.oxen.ai/reading-list-for-andrej-karpathys-intro-to-large-language-models-video/
網友寫的筆記: https://labs.botsnova.com/2023/11/26/%e9%97%9c%e6%96%bc-andrej-karpathy-%e7%9a%84-intro-to-large-language-models-%e7%9a%84%e4%b8%80%e4%ba%9b%e7%ad%86%e8%a8%98/
* 開頭用 llama 2 70b 模型就是 參數檔案+ c code 舉例,並且講了這是一種有損壓縮
* 用 NN 來預測下一個 token 機率
* 會有幻覺,無法 100%確定
* LLM 是經驗主義
* 介紹模型預訓練和微調
* LLM Scaling Laws
* 只要 參數量 和 訓練量 增加,就可以保證一定提升 LLM 效能
* 算法改進只是 bonus
* 介紹用外部工具: Bing search, 計算機, code interpreter 畫圖, DELL-E
* 介紹 GPT-4V 轉 website
* 多模態 multi-modal 和 Audio
(以下是比較新知的內容)
* 未來發展1
* 人有 System 1 跟 System 2
* 但是 LLM currently only have a System 1
* 希望透過 convert time to accuracy 達成 think,例如 ToT
* 目標是之後可以跟 GPT 直接講說: 這件事情你可以慢慢想30分鐘沒關係
* 做出一個 思考時間 跟 準確性 成正比的系統
* 未來發展2
* Self-improvement
* 參考自 AlphaGo
* 第一階段是模仿人類專家,但無法超越人類
* 第二階段是 self-improvement (reward = win the game),可以超越人類
* LLM 目前是第一階段,第二階段會是?
* 困難是於沒有通用的 reward function
* 在狹窄領域是有可能可行,還是未解之謎
* 未來發展3
* Custom LLMs
* custom GPTs 是最新嘗試,但只有改 prompt, RAG 等
* 之後可以想像會有 微調 可以客製
* LLM OS 的比喻
* LLM 不是 chatbot,而是一個 OS 發展
* 也有區分 開源跟不開源 OS
* LLM Security
* Jailbreak
* 可用角色扮演越獄
* powerful 又難以阻擋
* claude 用 base64 再問一次,也可以越獄
* 這是因為拒絕訓練大多是用英文訓練的....
* Universal Transferable Suffix
* 圖片也可以藏有害 noise
* Prompt injection
* 可以藏看不見的 injection 文字
* Bard 和 Apps Script 攻擊案例
* Data poisoning / Backdoor attacks
* 藏在預訓練資料裡面,有特定的觸發詞可以破壞模型
* 安全性還有很多議題....