2023/12/16 在 RubyConf Taiwan 2023 的演講
投影片: gamma.app/docs/RubyConf-Generative-AI-Engineer-LLM-Roadmap-c0srg8tihlcq9y4
😆 👨🏻💻 📚 🚀 💰 ✨
Hello! 你好 👋
OpenAI DevDay 已經過去快一個月,資訊量大爆炸。本期回顧一些值得關注的內容。
閱讀全文〈愛好 AI Engineer 週報 🚀 OpenAI DevDay 精彩內容回顧 #04〉Hello! 你好 👋
AI Engineer Summit 已經過去快一個月,官方除了陸續釋出後製錄影,原先直撥沒有的 Workshop 也有資料了,讓我們來看看。
👍Writing Principles for Task-Tuned Prompt Engineering 筆記
這場由 Anthropic 的研究員 Karina Nguyen 帶來的 Prompting 演講,有錄影跟投影片。
一小時的演講,但內容其實蠻多的,需要花點時間才能吸收,我有寫了筆記整理,不一定要看錄影。
* 開場講了為何 Prompting 很難,以及一些 Principles。
* 一個案例是講者做的推薦系統,根據用戶輸入推薦適合的衣服,給 Criteria 和使用 CoT。
* 解說他們的 Paper: Question Decomposition Improves the Faithfulness of Model-Generated Reasoning 透過分解成子問題,可以提昇模型回答能力。 Anthropic 的做法跟其他人做 Decomposition 又有點不一樣,有興趣的話可以仔細研究差異。
* 解說他們 Blog: Prompt engineering for Claude’s long context window 這個實驗很有趣,可以一讀。
Hello! 你好
我是 ihower,以下是本週 AI Engineer 電子報內容。
Poe AI Chatbot 和 SurgeAI 合作,針對主流可商用的 LLM 進行了系統性評估和排名,代表實際用戶在 Poe 聊天機器人的使用情況。評估項目包括推理能力、非英語流利程度、 創造力和寫作能力。以下是一些結果:
* GPT-4 在所有維度都是第一,其他模型只能搶第二名。當然, 這裡沒考慮成本,GPT-4 的費用可是其他模型的數十倍昂貴。
* Google PaLM 在非英語能力排第二
* Claude 2 在推理能力排第二,這包括邏輯推理、益智推理、Coding 和計算等
* GPT-3.5-Turbo 在創造力跟寫作排第二
Poe 做的這個評測排行我覺得蠻實用的,目前有在雲端上提供 Token-based 計費的 API 服務,也就是 OpenAI, Google, Claude, Llama 這幾家主流模型。
閱讀全文〈愛好 AI Engineer 週報 🚀 Poe 的 LLM 模型排名 #02〉Hello! 你好 👋
我是 ihower,這一期我們來分享上週在舊金山舉辦的第一屆 AI Engineer Summit 高峰會。
這場 Conference 的定位是針對軟體工程師,因此講者跟題目,和機器學習研究的研討會很不一樣。
沒有講 Transformer 深度學習模型、沒有講如何訓練模型、沒有講各種最新的 LLM 模型發展,投影片也很少提到 papers。
而是更多談開發框架、評估、RAG、Agents、AI 產品、UX 等等議題。
我也來開電子報啦 ,定位是針對會寫點 code 的朋友,提供關於 AI Engineer, LLM 應用開發, Prompt Engineering 等比較深入的內容跟推薦文章。
發信頻率希望能維持隔週一次。我不求發布最快的 AI 相關新聞,或是分享最前沿的研究 papers。而是希望針對應用軟體工程師、全端工程師們,提供開發 AI 應用能派上用場的內容。
訂閱 愛好 Generative AI Engineer 電子報 ihower.tw/opt-in/gai
瀏覽所有期數點這
以下是電子報第0篇內容。
閱讀全文〈愛好 AI Engineer 週報 🚀 生成式 AI 工程師的崛起 #00〉