愛好 AI Engineer 電子報 🚀 大神 AK 加入 Anthropic #37

歡迎訂閱 📬 愛好 AI Engineer 電子報 過往期數點這 📚

Hello! 各位 AI 開發者大家好 👋

幾個我關注的消息:

🧠 大神 Andrej Karpathy 宣佈加入 Anthropic — 本週最大八卦新聞(AK 推文

🔊 OpenAI 新的 Realtime Models — OpenAI 發了三個即時語音模型: GPT-Realtime-2(即時語音模型)、GPT-Realtime-Translate(70+ 語言即時翻譯)、GPT-Realtime-Whisper(串流語音轉文字)。(官方文章

📊 社群風向: Claude 4.7 不如預期,GPT-5.5 好評 + Codex App 繼續大爆發 — Claude Opus 4.7 四月中出來後,社群體感覺得沒有明顯提升,甚至有退步的聲音。更讓 API 用戶不滿的是,4.7 換了新的 tokenizer,相同的輸入會產生多 20–45% 的 tokens(官方說法是 1.0–1.35x,Simon Willison 實測最高到 1.47x)。雖然每 token 單價沒變,但實際帳單是變貴的,OpenRouter 真實流量分析顯示成本增加 12–27%,等於是隱性漲價(分析12)。相比之下 GPT-5.5 評價普遍正面,Codex App 搭配 GPT-5.5 之後實用性再上一個台階,兩家競爭越來越激烈了。

🪦 OpenAI API 關閉 fine-tuning 模型微調功能,至於 Claude API 從頭到尾都沒提供,Gemini API 曾經有但現在也關閉了(要在 Vertex AI 裡面還可以微調舊的 Gemini 2.5)。
對多數 AI 工程來說, 微調從來就不是主流路線。做 prompt/context/harness engineering 幾乎就夠忙了。
如果需要微調的話,現在只能用開源模型了。(我的觀察

🤖 最近覺得厲害的黑科技: Interaction Models — 前 OpenAI CTO Mira Murati 創辦的 Thinking Machines Lab 發表了一個原生支援「邊說邊聽邊思考」的即時 AI 模型。目前的即時語音 AI(包括 OpenAI GPT-Realtime 和 Gemini Live)本質上還是「輪流說話」的回合制,要先透過 VAD 偵測你講完,模型才開始回覆。而這個 Interaction Models 透過每 200 毫秒的微輪次,讓模型不再有明確的「你的回合 / 我的回合」邊界,持續同時處理音訊、影像和文字三模態,還有前台互動模型 + 後台推理模型的雙層架構。

他們設計的幾個全新 benchmark(主動開口、適時插話、即時辨識影片動作邊界等),用 GPT-Realtime-2.0 測幾乎都是零分,因為回合制架構根本無法處理「持續感知 + 主動回應」的任務。推薦看他們網頁上 Figure 8 的 demo,體驗完全不同等級。沒想到即時互動可以做到這種程度,Realtime AI 的天花板被往上推了一大截。(我的觀察

📺 Google I/O 2026 — 有興趣的可以去看 Google 官方整理的 100 項公告

⬇️ 以下是自上期以來,使用 AI 整理生成的文章 ⬇️

內容很多,我就不一一點評摘要了,特別推薦的我放個 👍

閱讀全文〈愛好 AI Engineer 電子報 🚀 大神 AK 加入 Anthropic #37〉

愛好 AI Engineer 電子報 🚀 AI 工具大換血: Claude Code + Codex 新組合 #36

歡迎訂閱 📬 愛好 AI Engineer 電子報 過往期數點這 📚

Hello! 各位 AI 開發者大家好 👋

距離上一期間隔有點久,這段時間除了工作忙碌,我的 AI 工具也有了新的變化。

上一期介紹的 OpenClaw 我已經換掉,改用 Claude Code CLI 搭配 tmuxtailscale 這套組合,將 Agent 跑在我的 Framework Desktop Ubuntu Desktop 電腦上開 --remote-control --dangerously-skip-permissions --chrome 持續跑著。原因很現實,就是 Claude Opus 跑 OpenClaw 的 API 帳單實在不是長久之計,近期如果要玩可以試試用 ChatGPT 訂閱,但我已經跳船了。

回頭講 tmux 可以讓你開多個指令視窗,並能切換前景背景(其實我十幾年前就用 screen 了,最近才換 tmux),好讓 Claude Code 能持續跑著,而 tailscale 可以讓伺服器和我的筆電,在任何地方都像內網一樣連通,筆電可以很方便 SSH 進去,手機可用 Moshi app。Claude Code 的 Remote Control 功能也可以讓我從瀏覽器或手機 Claude app 連上對話使用,這功能一開始推出時還會斷線,現在蠻穩的。反倒是 Telegram channel 功能不夠穩,同時多開 Agents 的情況下有問題,我用了一陣子就放棄了(也許最近有改進?)。

我個人 AI Agent 助理改採用 Claude Code,但我日常 AI coding 工具,反倒從 Claude Code 逐漸換到 OpenAI Codex 了,最近新版 Codex app 加上 GPT-5.5 開 fast mode 又快又好,訂閱給的 tokens 量又多。我其實認為 AI Coding 用 CLI 只是暫時解,單純是因為 IDE 還沒摸索出適合的人類介面,只好回到 CLI 才能發揮最大模型能力不被 GUI 所限制。一旦 GUI 設計出適合的人類介面,體驗超過 CLI 是必然的。

這方面 OpenAI 對於 app 的投入我覺得比 CLI 做得更好。不是每個人都喜歡折騰 tmux 設置多切割畫面背一堆快捷鍵,Codex app 的設計是在左側欄用專案區分對話,可以隨時切換不同專案多工,中間是 agent 對話,右側欄可以審查輸出結果,看 code diff 並針對留言,因此就不一定都需要開 Code Editor 了(這個我也改用 Zed 打開速度超快)。還有 in-app browser 可以讓 Agent 操作,而新的 Computer Use 也很有趣(詳見我的觀察)。總之,我現在是 Claude $100 + OpenAI $100 雙訂閱,如果你要用 Codex,我推薦試試它的桌機版,而不是 CLI。

AI 時代的先行者優勢很短暫,後進者只要跟得上就有機會超車,當然也可能反轉後又再反轉。不只 AI 廠商如此,個人學習、企業導入也都是如此。早期進場的,如果沒有跟著新模型迭代、捨不得拋棄舊做法和舊工具,很可能還不如新進場的人。共勉之。

⬇️ 以下是自上期以來,使用 AI 整理生成的文章 ⬇️

內容很多,我就不一一點評摘要了,特別推薦的我放個 👍

閱讀全文〈愛好 AI Engineer 電子報 🚀 AI 工具大換血: Claude Code + Codex 新組合 #36〉

愛好 AI Engineer 電子報 🚀 新型態代理人 OpenClaw 正夯,電子報改版 #35

歡迎訂閱 📬 愛好 AI Engineer 電子報 過往期數點這 📚

Hello! 各位 AI 開發者大家好 👋

跟大家拜個晚年!過年假期在玩 OpenClaw 非常有趣。

它是一個開源的自架 AI Agent 軟體,常駐在你的伺服器上。你會透過 Telegram、Discord 等通訊渠道,隨時隨地交代任務。等於擁有一個可以操作整台電腦、定時執行任務的個人助理。

我在 Facebook 上有分享了一些經驗,也有了一些新的想法:

目前玩法是把 OpenClaw 的 AI Agent (就叫蝦蝦吧)當作我的新員工看待,盡量只用 Telegram 交代他做事 (雖然偶爾還是會有出戲感,會需要手動SSH進去Server排除技術問題)
帳號也都是開新的給他,只開他任務需要知道的權限,而不是讓他去接手我的帳號權限。我認為這是比較好的安全界線。

這是我給蝦蝦新建立的帳號:

從本期電子報起,分享的文章摘要內容,會更直接就是 AI 生成的,會明確區分哪些內容完全是 AI 產出的。
相比之前電子報有花時間每篇人工審稿修改,之後會更放手直接就放 AI 產出,反正大家也看習慣 AI 摘要了(?)

不過放心,選題還是我真人做: 選擇哪些東西值得寫值得分享,還是有人類的聯想、判斷力和直覺。因此要分享哪些文章主題,都是我是挑好才交給 AI 後續處理的。

對於 AI 生成內容的閱讀建議: 只是幫助你快速掌握原文重點的導讀。畢竟原文往往篇幅較長、不容易快速消化,透過翻譯與摘要,
你可以在短時間內了解核心概念。但請留意,摘要無法涵蓋所有細節與脈絡。如果讀完覺得有興趣,強烈推薦點進原文獲得完整資訊。

換句話說: 時間充裕的話,可以直接點原文閱讀。如果時間有限,可以先看中文導讀,有興趣再深入原文。
無論如何,我對自己挑選要分享的原文還是有信心都是很好的內容 😄

在本期分享的精彩文章中,有幾篇我特別有收穫:

⬇️⬇️ 以下是我挑選文章後,由 AI 生成的內容 ⚠️⚠️

閱讀全文〈愛好 AI Engineer 電子報 🚀 新型態代理人 OpenClaw 正夯,電子報改版 #35〉

Agentic Search: 搜尋技術不會消失,只是變成 Agent 工具

看了兩場關於 Agentic Search 的演講,分別來自 AWS OpenSearch 的 John Handler 和 AI-Powered Search 這本書的作者 Doug Turnbull (這有很多檢索知識文章,超讚),兩位都在探討: AI Agent 是否正在取代幾十年累積的搜尋智慧?

閱讀全文〈Agentic Search: 搜尋技術不會消失,只是變成 Agent 工具〉

愛好 AI Engineer 電子報 🚀 2025 Q4 AI 模型與 Agent 開發 #33

歡迎訂閱 📬 愛好 AI Engineer 電子報 過往期數點這 📚

Hello! 各位 AI 開發者大家好 👋

2025 Q4 各家陸續推出新模型,SOTA 模型輪流當。以下整理新模型消息,以及集結我最近發表的內容。

閱讀全文〈愛好 AI Engineer 電子報 🚀 2025 Q4 AI 模型與 Agent 開發 #33〉