愛好 AI Engineer 電子報 🚀 Claude Fable 來了 + Tokenmaxxing 失靈中 #38

歡迎訂閱 📬 愛好 AI Engineer 電子報 過往期數點這 📚

Hello! 各位 AI 開發者大家好 👋

話說 tokenmaxxing 就是「能燒多少 token 就燒多少」的意思:同時開一堆 agent、塞超長 context、能用貴模型就不用便宜的,讓 token 用量衝越高越好。

一開始它幾乎是個正面的詞,不少公司搞起「token 消耗排行榜」,結果一堆公司燒爆預算。這根本是 AI 時代的「用程式碼行數衡量生產力」。然而隨著模型漲價、coding agent 又繼續進步、能燒 token 的招式越來越多(例如新的 Goal 功能、loop 排程、dynamic workflow 等等),這套玩法逐漸失靈。

一方面新模型本身漲價,GPT-5.5 是 GPT-5.4 的兩倍價,Opus 4.7/4.8 則因為換了 tokenizer 造成隱形漲價,大約是 4.6 的 1.4 倍;另一方面,近期 OpenAI 和 Anthropic 都全面推出新的 Enterprise 企業方案計價,一律 API 計費、沒有訂閱折扣,得照 token 用量付滿 API 價格,那種 $100、$200 訂閱方案的大幅折扣,大型企業客戶已經沒得用了。

一個人一個月燒幾千美金,也許還能接受生產力有大幅增加;但當價格一路漲到一個人一個月要燒上萬美金時,整個 tokenmaxxing 現象就需要反思划不划算,不能無腦開最強模型去消耗 tokens 了,得開始思考如何更有效率。

近期大新聞就是 6/9 Anthropic 發表 Claude Fable 5 與 Mythos 5,是 Opus 之上的新「Mythos 等級」。其中 Fable 5 是公開的降級版本,內建更嚴格的安全分類器,會把約 5% 的敏感請求轉去給 Opus 4.8 處理;而真正的 Mythos 5 則只開放給 Project Glasswing 的資安夥伴。

🔥 Fable 5 各方評測下來是真的超強,幾乎各項評測都拿第一,但也真的貴,是 Opus 4.8 的兩倍以上,加上性能降級問題:大約 5% 被降級到 Opus 4.8,主要是資安、生物、化學領域(我在這篇有寫到),還有 ZDR 問題,會強制保留資料 30 天。

訂閱方面,6/22 前還可以算在 Claude 訂閱額度內,6/23 之後就得走 API 計費,沒有訂閱折扣了(官方說到時候再看看,可能有變動)。

說到訂閱,SemiAnalysis 各買一份 Anthropic / OpenAI 訂閱,把每週額度跑爆來實測(出處X),發現訂閱制其實被大幅補貼,實際榨得出的價值遠超月費。大家以為 $200/月 頂多換到 ~$2,000/月 的 token,結果發現補貼大得多:$200 的 claude-max-20x 最多能榨出約 $8,000 的 API 計價用量,OpenAI 的 chatgpt-pro-20x 更到 $14,000。因此訂閱費其實是比 API 收費少很多的生意,但目前若直接大幅砍額度,會引爆民怨,所以他們判斷之後很可能會把新功能、新模型只允許用 API 收費,訂閱維持補貼但拿不到最新的,也就是 Anthropic 這次在 Fable 上的做法。總之,目前訂閱制能用這麼多額度享受最頂尖模型,幾乎是不可持續的,大家要有心理準備了。接下來 OpenAI 即將推出 gpt-5.6/gpt-6,可以觀察看看他們會怎麼應對這個趨勢。

⬇️ 以下是自上期以來,使用 AI 整理生成的文章 ⬇️

內容很多,我就不一一點評摘要了,特別推薦的我放個 👍


另外,原定這期的 🔧 Harness Engineering 特輯要延到第 39 期了,這次憋個大招,會跟 6/26 Gen AI 年會的演講一起發布,敬請期待。

希望你會喜歡這集內容!有任何想跟我分享的事情,也歡迎直接回覆這封信給我。

– ihower

發佈留言

發表迴響