愛好 AI Engineer 週報 🚀 Poe 的 LLM 模型排名 #02

Hello! 你好 👋

我是 ihower,以下是本週 AI Engineer 電子報內容。

🔝Poe bot ranking

Poe AI Chatbot 和 SurgeAI 合作,針對主流可商用的 LLM 進行了系統性評估和排名,代表實際用戶在 Poe 聊天機器人的使用情況。評估項目包括推理能力、非英語流利程度、 創造力和寫作能力。以下是一些結果:

* GPT-4 在所有維度都是第一,其他模型只能搶第二名。當然, 這裡沒考慮成本,GPT-4 的費用可是其他模型的數十倍昂貴。
* Google PaLM 在非英語能力排第二
* Claude 2 在推理能力排第二,這包括邏輯推理、益智推理、Coding 和計算等
* GPT-3.5-Turbo 在創造力跟寫作排第二

Poe 做的這個評測排行我覺得蠻實用的,目前有在雲端上提供 Token-based 計費的 API 服務,也就是 OpenAI, Google, Claude, Llama 這幾家主流模型。

閱讀全文〈愛好 AI Engineer 週報 🚀 Poe 的 LLM 模型排名 #02〉

愛好 AI Engineer 週報 🚀 AI Engineer Summit 特輯 #01

Hello! 你好 👋

我是 ihower,這一期我們來分享上週在舊金山舉辦的第一屆 AI Engineer Summit 高峰會。

這場 Conference 的定位是針對軟體工程師,因此講者跟題目,和機器學習研究的研討會很不一樣。
沒有講 Transformer 深度學習模型、沒有講如何訓練模型、沒有講各種最新的 LLM 模型發展,投影片也很少提到 papers。
而是更多談開發框架、評估、RAG、Agents、AI 產品、UX 等等議題。

閱讀全文〈愛好 AI Engineer 週報 🚀 AI Engineer Summit 特輯 #01〉

愛好 AI Engineer 週報 🚀 生成式 AI 工程師的崛起 #00

我也來開電子報啦 ,定位是針對會寫點 code 的朋友,提供關於 AI Engineer, LLM 應用開發, Prompt Engineering 等比較深入的內容跟推薦文章。

發信頻率希望能維持隔週一次。我不求發布最快的 AI 相關新聞,或是分享最前沿的研究 papers。而是希望針對應用軟體工程師、全端工程師們,提供開發 AI 應用能派上用場的內容。

訂閱 愛好 Generative AI Engineer 電子報 👉 ihower.tw/opt-in/gai
瀏覽所有期數點這


以下是電子報第0篇內容。

閱讀全文〈愛好 AI Engineer 週報 🚀 生成式 AI 工程師的崛起 #00〉

LLM 筆記和 Telegram 群

最近時間花在研究 LLM 大語言模型和 OpenAI 上,除了做 AI side project,也(正在)上一堆熱騰騰的課程。因為進展很快沒有發在 blog 上,用 Obsidian 寫筆記很方便,再搭配 Obsidian Publish 功能一鍵發佈超讚。

  • LLM 學習資料 整理了一些我推薦的內容和筆記。雖然筆記主要是我自己紀錄學到的東西,不過我想應該還是有點價值可以公開出來,可以大致了解課程內容在教什麼,看看有什麼參考資料,有興趣的話再深入去上課就好了。
  • 新開的 Telegram討論群,歡迎加入討論。我也會分享會貼一些新聞跟好文。

這波 AIGC 浪潮真是又快又捲,每天都有看不完的資料,很是焦慮。雖然躺平等一切成熟之後再學,也是一種方式。不過就像17年前從 Rails 1.1 開始學,這種跟著技術一起成長是一種難得的時代機遇跟樂趣啊 😙😀