愛好 AI Engineer 電子報 🚀 Claude Fable 來了 + Tokenmaxxing 失靈中 #38

歡迎訂閱 📬 愛好 AI Engineer 電子報過往期數點這 📚

Hello! 各位 AI 開發者大家好 👋

話說 tokenmaxxing 就是「能燒多少 token 就燒多少」的意思：同時開一堆 agent、塞超長 context、能用貴模型就不用便宜的，讓 token 用量衝越高越好。

一開始它幾乎是個正面的詞，不少公司搞起「token 消耗排行榜」，結果一堆公司燒爆預算。這根本是 AI 時代的「用程式碼行數衡量生產力」。然而隨著模型漲價、coding agent 又繼續進步、能燒 token 的招式越來越多（例如新的 Goal 功能、loop 排程、dynamic workflow 等等），這套玩法逐漸失靈。

一方面新模型本身漲價，GPT-5.5 是 GPT-5.4 的兩倍價，Opus 4.7/4.8 則因為換了 tokenizer 造成隱形漲價，大約是 4.6 的 1.4 倍；另一方面，近期 OpenAI 和 Anthropic 都全面推出新的 Enterprise 企業方案計價，一律 API 計費、沒有訂閱折扣，得照 token 用量付滿 API 價格，那種 $100、$200 訂閱方案的大幅折扣，大型企業客戶已經沒得用了。

一個人一個月燒幾千美金，也許還能接受生產力有大幅增加；但當價格一路漲到一個人一個月要燒上萬美金時，整個 tokenmaxxing 現象就需要反思划不划算，不能無腦開最強模型去消耗 tokens 了，得開始思考如何更有效率。

近期大新聞就是 6/9 Anthropic 發表 Claude Fable 5 與 Mythos 5，是 Opus 之上的新「Mythos 等級」。其中 Fable 5 是公開的降級版本，內建更嚴格的安全分類器，會把約 5% 的敏感請求轉去給 Opus 4.8 處理；而真正的 Mythos 5 則只開放給 Project Glasswing 的資安夥伴。

🔥 Fable 5 各方評測下來是真的超強，幾乎各項評測都拿第一，但也真的貴，是 Opus 4.8 的兩倍以上，加上性能降級問題：大約 5% 被降級到 Opus 4.8，主要是資安、生物、化學領域（我在這篇有寫到），還有 ZDR 問題，會強制保留資料 30 天。

訂閱方面，6/22 前還可以算在 Claude 訂閱額度內，6/23 之後就得走 API 計費，沒有訂閱折扣了（官方說到時候再看看，可能有變動）。

說到訂閱，SemiAnalysis 各買一份 Anthropic / OpenAI 訂閱，把每週額度跑爆來實測（出處X），發現訂閱制其實被大幅補貼，實際榨得出的價值遠超月費。大家以為 $200/月頂多換到 ~$2,000/月的 token，結果發現補貼大得多：$200 的 claude-max-20x 最多能榨出約 $8,000 的 API 計價用量，OpenAI 的 chatgpt-pro-20x 更到 $14,000。因此訂閱費其實是比 API 收費少很多的生意，但目前若直接大幅砍額度，會引爆民怨，所以他們判斷之後很可能會把新功能、新模型只允許用 API 收費，訂閱維持補貼但拿不到最新的，也就是 Anthropic 這次在 Fable 上的做法。總之，目前訂閱制能用這麼多額度享受最頂尖模型，幾乎是不可持續的，大家要有心理準備了。接下來 OpenAI 即將推出 gpt-5.6/gpt-6，可以觀察看看他們會怎麼應對這個趨勢。

⬇️ 以下是自上期以來，使用 AI 整理生成的文章 ⬇️

內容很多，我就不一一點評摘要了，特別推薦的我放個 👍

另外，原定這期的 🔧 Harness Engineering 特輯要延到第 39 期了，這次憋個大招，會跟 6/26 Gen AI 年會的演講一起發布，敬請期待。

希望你會喜歡這集內容！有任何想跟我分享的事情，也歡迎直接回覆這封信給我。

– ihower

愛好 AI Engineer 電子報 🚀 Claude Fable 來了 + Tokenmaxxing 失靈中 #38

⬇️ 以下是自上期以來，使用 AI 整理生成的文章 ⬇️

請按讚：

發佈留言

發表迴響取消回覆

⬇️ 以下是自上期以來，使用 AI 整理生成的文章 ⬇️

分享此文：

請按讚：

發佈留言

發表迴響取消回覆