
Hello! 各位 AI 開發者大家好 👋
話說 tokenmaxxing 就是「能燒多少 token 就燒多少」的意思:同時開一堆 agent、塞超長 context、能用貴模型就不用便宜的,讓 token 用量衝越高越好。
一開始它幾乎是個正面的詞,不少公司搞起「token 消耗排行榜」,結果一堆公司燒爆預算。這根本是 AI 時代的「用程式碼行數衡量生產力」。然而隨著模型漲價、coding agent 又繼續進步、能燒 token 的招式越來越多(例如新的 Goal 功能、loop 排程、dynamic workflow 等等),這套玩法逐漸失靈。
一方面新模型本身漲價,GPT-5.5 是 GPT-5.4 的兩倍價,Opus 4.7/4.8 則因為換了 tokenizer 造成隱形漲價,大約是 4.6 的 1.4 倍;另一方面,近期 OpenAI 和 Anthropic 都全面推出新的 Enterprise 企業方案計價,一律 API 計費、沒有訂閱折扣,得照 token 用量付滿 API 價格,那種 $100、$200 訂閱方案的大幅折扣,大型企業客戶已經沒得用了。
一個人一個月燒幾千美金,也許還能接受生產力有大幅增加;但當價格一路漲到一個人一個月要燒上萬美金時,整個 tokenmaxxing 現象就需要反思划不划算,不能無腦開最強模型去消耗 tokens 了,得開始思考如何更有效率。
近期大新聞就是 6/9 Anthropic 發表 Claude Fable 5 與 Mythos 5,是 Opus 之上的新「Mythos 等級」。其中 Fable 5 是公開的降級版本,內建更嚴格的安全分類器,會把約 5% 的敏感請求轉去給 Opus 4.8 處理;而真正的 Mythos 5 則只開放給 Project Glasswing 的資安夥伴。
🔥 Fable 5 各方評測下來是真的超強,幾乎各項評測都拿第一,但也真的貴,是 Opus 4.8 的兩倍以上,加上性能降級問題:大約 5% 被降級到 Opus 4.8,主要是資安、生物、化學領域(我在這篇有寫到),還有 ZDR 問題,會強制保留資料 30 天。
訂閱方面,6/22 前還可以算在 Claude 訂閱額度內,6/23 之後就得走 API 計費,沒有訂閱折扣了(官方說到時候再看看,可能有變動)。
說到訂閱,SemiAnalysis 各買一份 Anthropic / OpenAI 訂閱,把每週額度跑爆來實測(出處X),發現訂閱制其實被大幅補貼,實際榨得出的價值遠超月費。大家以為 $200/月 頂多換到 ~$2,000/月 的 token,結果發現補貼大得多:$200 的 claude-max-20x 最多能榨出約 $8,000 的 API 計價用量,OpenAI 的 chatgpt-pro-20x 更到 $14,000。因此訂閱費其實是比 API 收費少很多的生意,但目前若直接大幅砍額度,會引爆民怨,所以他們判斷之後很可能會把新功能、新模型只允許用 API 收費,訂閱維持補貼但拿不到最新的,也就是 Anthropic 這次在 Fable 上的做法。總之,目前訂閱制能用這麼多額度享受最頂尖模型,幾乎是不可持續的,大家要有心理準備了。接下來 OpenAI 即將推出 gpt-5.6/gpt-6,可以觀察看看他們會怎麼應對這個趨勢。
⬇️ 以下是自上期以來,使用 AI 整理生成的文章 ⬇️
內容很多,我就不一一點評摘要了,特別推薦的我放個 👍
- 當模型表現取決於推論算力: 評測分數正在失去意義,LLM 能力上限也量不出來 👍
- Microsoft AI: 從零練起的 MAI 模型和平台佈局
- 從 Code Act 到 Claude Code Dynamic Workflows 深度技術解析
- Codex App 那些 CLI 做不到的 GUI 特色 👍
- Coding Agent 作為軟體優化器: 從 Autoresearch 說起
- 向量已死? Grep 萬能? 不,你需要的是「策展」一組檢索工具 👍
- 如何用 AI 分析 Agent traces? 持續改進 Agent 產品
- 從 Token 串流到 Agent 事件串流: OpenAI、AG-UI、Vercel、LangChain 的格式設計比一比
- 當寫 code 不再是瓶頸: Anthropic 的 AI-native 工程組織,與那些不買單的聲音
- 為下一個模型而寫,別為上一個: Anthropic 三場演講的開發心法 👍
- GitHub Copilot 大規模使用 Claude 的工程心法: 快取、多模型調度與評測
- Replit 如何規模化評測和持續改進 Vibe coding 👍
- 我錯了,還是要讀程式碼: Dex Horthy 重新檢討 AI 寫程式流程
- Alex Wang 首次長訪: 從 Scale AI 到重建 Meta AI,以及他眼中的超級智慧之路
- 別再看 AI 預測文了: Cedric Chin 的 Sensemaking 三部曲教你怎麼真正看懂 AI 👍
另外,原定這期的 🔧 Harness Engineering 特輯要延到第 39 期了,這次憋個大招,會跟 6/26 Gen AI 年會的演講一起發布,敬請期待。
希望你會喜歡這集內容!有任何想跟我分享的事情,也歡迎直接回覆這封信給我。
– ihower