最近看到一場關於 AI Evals 的精彩論戰,爭論焦點不在模型訓練層面的評估(這個大家都有共識要做),而是 …
分類彙整: LLM
從 Prompting 基本結構到 Agent Prompting 設計原則
Anthropic 最近才釋出了他們在 2025/5/22 開發者大會的完整影片,當時的重頭戲是 Claude …
OpenAI GPT-5 API 更新重點整理
OpenAI 於 2025/8/7 推出 GPT-5,包括 ChatGPT 和 API 都同時上線,這裡針對 …
Agent 讓 RAG 過時了嗎? 談 AI Coding 的檢索策略
看了一場 Augment Code (也是一家做 AI IDE 的廠商) 來講 “Agentic …
如何管理 AI 專案? AI PM 從確定性工程到應用研究
最近看了幾篇討論 AI 產品經理和 AI 專案管理的內容,最有感的是這句話:「傳統軟體開發是確定性的,但 AI …
什麼是 AI 應用評估的錯誤分析 Error Analysis?
最近在上 Hamel + Shreya 的 AI Evals For Engineers & PMs …