> 歡迎訂閱我的 [AI Engineer 電子報](https://aihao.eo.page/6tcs9) 和瀏覽 [[Generative AI Engineer 知識庫]]
影片: https://www.youtube.com/watch?v=YXiRbRacTF0
> 不是特別講技術的演講,而是了解 OpenAI 研究和產品 之間的關係,以及他們是如何思考產品化對設計模型的影響
* Going back to October 2022
* 當時在考慮產品要做 general 或特定任務
* 以及當時內部已經在用 GPT-4,但產品要用 GPT-3.5。因為前者還沒準備好釋出
## Post-training research team
* 在訓練後,在 ChatGPT 和 APT 之前進行採用
* 做增強模型的研究
* 教模型如何 behave
* 研究時程從 1 day 到 1 year 以上都有可能
![[Pasted image 20231124092754.png]]![[Pasted image 20231124092921.png]]
![[Pasted image 20231124093009.png]]
以前是訓練特定任務
![[Pasted image 20231124093022.png]]
現在通用化了
![[Pasted image 20231124094034.png]]
UI 變簡單了
![[Pasted image 20231124094130.png]]
![[Pasted image 20231124094145.png]]
一般人也可以了解 AI 在幹嘛了
![[Pasted image 20231124094159.png]]
## Product helping Research
研究和產品互相回饋
![[Pasted image 20231124094256.png]]
![[Pasted image 20231124094353.png]]
![[Pasted image 20231124094409.png]]
* The product is a meaningful and smooth objective towards general intelligence
* 產品可以幫助研究,有實際用戶數據回饋
### (換 Joanne Jang 上台)
![[Pasted image 20231124094637.png]]
* The model is the product
## Product at OpenAI
* 3 relatively unique aspects
* Ambiguity++
* OpenAI 的目標不是傳統產品指標,例如營收
* 最高目標是要 AGI 是造福人類,但這目標太高層次模糊了,對我們中間定義 milestone, 優先順序時,我們會有哲學上的討論歧異
* Technology first
* 標準的產品開發,是從用戶需求開始
* 從頭思考問題從何開始
* 但 OpenAI PM 必須思考如何將研究導入產品
* Research collaboration
* OpenAI 的產品和研究合作程度超高
* 別家是研究做完,丟給產品就結束了
## Taking a bet on dialogue interfaces
![[Pasted image 20231124095452.png]]
* GPT-3 會預測下一次詞,但沒有對齊用戶需求
![[Pasted image 20231124095639.png]]
* InstructGPT 可以對齊用戶需求了,但只有一次QA往返,沒有對話
![[Pasted image 20231124095733.png]]
* ChatGPT 有訓練多輪對話資料了,可以對話了
* 對話讓我們不需要一直重複輸入上下文
* 人類習慣用對話來教,方便我們可以教模型學習新行為
## Designing model behavior
* 從產品角度來看,我們很關注 "intuitive" 直覺
![[Pasted image 20231124100343.png]]
![[Pasted image 20231124100403.png]]
AI 這種回答很不有趣,而且浪費你的 tokens
![[Pasted image 20231124100459.png]]
這種問題,我們有和政策和安全專家討論定義拒絕回答的範圍,但是仍然不完美,但是 Joanne 個人不覺得需要做到完全拒絕。
模型如何建構和表達回應很重要,應該帶大家前進,而不是讓人感到困惑
![[Pasted image 20231124100859.png]]
我們希望做出這種 直覺的回答
但是改變模型行為並不容易,最大挑戰要找出預設行為,例如
![[Pasted image 20231124100944.png]]
希望不妨礙實用,又不要太花俏
但這件事情非常用戶主觀
> 16:20 有可愛的 Meow 聲
![[Pasted image 20231124101150.png]]
最好的模型會是個人客製化的,了解你的需求
![[Pasted image 20231124101313.png]]
Custom instructions
但是仍不能解決所有問題,仍在思考更好的作法針對用戶的 use case
![[Pasted image 20231124101449.png]]
![[Pasted image 20231124101514.png]]