這是 OpenAI DevDay 2024 舊金山場 10/1 的四大重點
分類彙整: LLM
提示詞 Prompt 自動最佳化: Textgrad 和 DSPy 通用範例
Prompt 自動最佳化的思路,就是用 AI 迭代產生上百上千個提示詞,透過自動化評估,從中挑一個表現最好的 …
評估驅動開發: 生成式 AI 軟體不確定性的解決方法
評估驅動開發 Eval-Driven Development (EDD): 生成式 AI 軟體不確定性的解決方 …
使用繁體中文評測 RAG 的 Chunking 切塊策略
延續之前做 Embedding 和 Reranker 評測,這次來研究 RAG 系統中的 Chunking 切 …
使用繁體中文評測各家 Reranker 模型的重排能力
(2024/7/25) 有新增內容 LLM-based Ranker 在最後 接續上一篇 Embedding …
使用繁體中文評測各家 Embedding 模型的檢索能力
📊 評估數據結果 google spreadsheets 傳送門 ↗️ Updated(2024/9/23): …