噪音
Andrej Karpathy 在 2025 年 2 月提出了「vibe coding」——用對話引導 AI 寫程式,而不是自己逐行撰寫。這個概念引起了共鳴,市場隨之爆發。現在的 AI coding 工具多到沒有人能合理地逐一評估。
但這不是真正的問題。

真正的問題是,你在網上找到的大部分內容——教學、示範、「5 分鐘搭建 X」的影片——都不是真正在做開發的人做的。他們在建登陸頁面、待辦事項 app、行銷文案生成器。一樣的淺層示範,反覆循環。
你看了,試了,心想*「嗯,還行」*。然後就沒有了。不清楚這些跟你的實際工作有什麼關係。不理解為什麼同一個 prompt 在某個工具裡表現很好,換一個就變成垃圾。
這個落差——示範和現實之間——就是大部分人卡住的地方。
唯一重要的區別
大部分的工具比較都在看功能:自動補全、對話、agent 模式、模型選擇。這些都是表面的。
真正能預測你使用體驗的區別是:框架和模型的耦合程度有多高?
每個 AI coding 工具都有兩層:
- 框架——你互動的介面。它負責檔案存取、專案上下文、規劃、指令執行和工作流程。
- 模型——負責推理、寫程式和做決策的 AI。
有些工具把這兩層綁在一起,有些讓你自由搭配。這兩種架構之間的選擇,決定了一切。
| 方式 | 例子 | 取捨 |
|---|---|---|
| 緊密耦合 | Claude Code(僅限 Claude) | 選擇少,最佳化深 |
| 鬆散耦合 | OpenCode(75+ 模型) | 選擇多,整合淺 |
| 中間路線 | GitHub Copilot(GPT、Claude、Gemini) | 精選模型,官方合作 |
當框架和模型一起打造時,每個互動都經過最佳化——系統提示、規劃步驟、錯誤修復、上下文的收集和回饋方式。框架知道模型如何思考。
分開的時候,框架發送通用 API 呼叫,然後祈禱結果好。能用,但有上限。
舉個具體的例子。Claude Code 在寫任何程式之前,會進入規劃階段:讀取你的專案結構、追蹤 import 鏈、檢查現有測試模式、映射依賴關係。然後才開始修改。這個工作流程存在的原因是框架圍繞 Claude 的推理方式而設計——它知道 Claude 在有充足上下文時表現更好,所以自動收集這些上下文。
一個通用框架透過 API 使用同一個模型,不會做這些事。它不了解 Claude 的偏好,只是發送 prompt。
煩躁測試

這是我選擇工具的實際方法。很簡單,但比任何跑分都可靠。
用這個工具做幾個小時的真實工作。注意你的感受。
不是看產出「厲不厲害」,不是看它處理精心設計的示範好不好。而是你在工作時的感受。
如果你開始覺得煩躁——工具沒聽懂你的意圖、走偏了方向、寫出你絕不會寫的東西、或者需要三次追問才能修正——這就是信號。
工具無法銜接你的思考和它的產出。
一個好的 AI coding 工具應該像跟一個能力出色的同事合作。你描述目標,它想出方法。你檢視和調整。這個循環應該感覺自然,而不是在搏鬥。
這直接對應 deTrouble 的原則:科技應該減少摩擦,而非製造摩擦。 如果一個工具增加了認知負擔——你花更多精力在管理工具而不是做事——那它就失敗了,不管跑分多好看。
煩躁測試同時也揭示了整合深度。緊密整合的工具讓你更少煩躁,因為框架能預判模型的行為。鬆散耦合的工具更容易讓你措手不及——而且不是好的那種驚喜。
關於跑分和蒸餾的提醒
說到跑分:小心。
有些第三方模型宣稱相容 Claude Code 之類的工具,提供「Anthropic 相容 API」。背後很多是通過蒸餾——大量餵入 Claude 的輸出到自己的訓練過程,模仿其行為。
2026 年 2 月,Anthropic 公開揭露數家供應商建立了超過 24,000 個假帳號,與 Claude 進行了超過 1,600 萬次對話,就是為了這個目的。
蒸餾出來的模型可能在標準化跑分上表現不錯。但跑分表現和真實使用中的可靠性是兩回事。一個記住了模式但沒有理解的模型,會在新場景中失敗——而那些正是你最需要工具幫忙的時候。
跑分告訴你模型在受控條件下能做什麼。煩躁測試告訴你它在你的條件下做得如何。
我的選擇
誠實地說明我的選擇和對應的取捨:
主力:Claude Code
框架和模型由同一個團隊(Anthropic)打造。整合深度是目前最高的。它在行動前規劃、驗證自己的產出、通過 MCP 連接外部工具。
不完美的地方:
- 終端原生——如果你沒用過 CLI,有學習門檻
- 費用——需要訂閱或 API 使用費
- 地區限制——不是所有地方都能用
- 僅限 Claude——你綁定了一個模型供應商
但對我來說,取捨是明確的。產出始終更接近我的意圖,來回修改更少,比我試過的任何其他工具都好。
替代方案:VS Code + GitHub Copilot(搭配 Claude)
當 Claude Code 不可用時,這是我推薦的組合。
VS Code 是使用最廣泛的編輯器,理由很充分——50,000+ 擴充套件、每月更新、穩定、免費。GitHub Copilot 的 agent 模式(自 VS Code 1.97 起)支援多檔案編輯、終端執行和自主規劃。因為 Microsoft 和 Anthropic 有正式合作關係,Claude 作為官方模型選項在 Copilot 中可用——整合是經過維護的,不是拼湊出來的。
你也可以在 VS Code 裡同時跑 Claude Code 的擴充套件,在一個編輯器中擁有兩種工作流程。
Copilot 每月 $10 就包含 Claude 模型存取,務實且有良好支援。
真正的重點
每隔幾個月,新工具出現,循環重新開始。新跑分、新示範、新炒作。人們追逐最新的東西,卻沒問過真正重要的問題:
這個工具是幫助我思考,還是讓我花時間去想工具本身?
最好的科技會消融在你的工作流程裡。你不再注意到它的存在。它就是能用——像呼吸空氣一樣。
這不是任何對比表格上會列出的功能。但它是唯一真正重要的。
延伸閱讀:為什麼你的下一個網站應該是 AI 原生的 | 先有框架,才能跳出框架