噪音

Andrej Karpathy 在 2025 年 2 月提出了「vibe coding」——用對話引導 AI 寫程式,而不是自己逐行撰寫。這個概念引起了共鳴,市場隨之爆發。現在的 AI coding 工具多到沒有人能合理地逐一評估。

但這不是真正的問題。

在 AI coding 工具的噪音中找方向

真正的問題是,你在網上找到的大部分內容——教學、示範、「5 分鐘搭建 X」的影片——都不是真正在做開發的人做的。他們在建登陸頁面、待辦事項 app、行銷文案生成器。一樣的淺層示範,反覆循環。

你看了,試了,心想*「嗯,還行」*。然後就沒有了。不清楚這些跟你的實際工作有什麼關係。不理解為什麼同一個 prompt 在某個工具裡表現很好,換一個就變成垃圾。

這個落差——示範和現實之間——就是大部分人卡住的地方。

唯一重要的區別

大部分的工具比較都在看功能:自動補全、對話、agent 模式、模型選擇。這些都是表面的。

真正能預測你使用體驗的區別是:框架和模型的耦合程度有多高?

每個 AI coding 工具都有兩層:

  • 框架——你互動的介面。它負責檔案存取、專案上下文、規劃、指令執行和工作流程。
  • 模型——負責推理、寫程式和做決策的 AI。

有些工具把這兩層綁在一起,有些讓你自由搭配。這兩種架構之間的選擇,決定了一切。

框架與模型:每個 AI coding 工具的兩層架構

方式例子取捨
緊密耦合Claude Code(僅限 Claude)選擇少,最佳化深
鬆散耦合OpenCode(75+ 模型)選擇多,整合淺
中間路線GitHub Copilot(GPT、Claude、Gemini)精選模型,官方合作

當框架和模型一起打造時,每個互動都經過最佳化——系統提示、規劃步驟、錯誤修復、上下文的收集和回饋方式。框架知道模型如何思考。

分開的時候,框架發送通用 API 呼叫,然後祈禱結果好。能用,但有上限。

舉個具體的例子。Claude Code 在寫任何程式之前,會進入規劃階段:讀取你的專案結構、追蹤 import 鏈、檢查現有測試模式、映射依賴關係。然後才開始修改。這個工作流程存在的原因是框架圍繞 Claude 的推理方式而設計——它知道 Claude 在有充足上下文時表現更好,所以自動收集這些上下文。

一個通用框架透過 API 使用同一個模型,不會做這些事。它不了解 Claude 的偏好,只是發送 prompt。

煩躁測試

真正的測試發生在實際工作中

這是我選擇工具的實際方法。很簡單,但比任何跑分都可靠。

用這個工具做幾個小時的真實工作。注意你的感受。

不是看產出「厲不厲害」,不是看它處理精心設計的示範好不好。而是你在工作時的感受

如果你開始覺得煩躁——工具沒聽懂你的意圖、走偏了方向、寫出你絕不會寫的東西、或者需要三次追問才能修正——這就是信號。

工具無法銜接你的思考和它的產出。

一個好的 AI coding 工具應該像跟一個能力出色的同事合作。你描述目標,它想出方法。你檢視和調整。這個循環應該感覺自然,而不是在搏鬥。

這直接對應 deTrouble 的原則:科技應該減少摩擦,而非製造摩擦。 如果一個工具增加了認知負擔——你花更多精力在管理工具而不是做事——那它就失敗了,不管跑分多好看。

煩躁測試同時也揭示了整合深度。緊密整合的工具讓你更少煩躁,因為框架能預判模型的行為。鬆散耦合的工具更容易讓你措手不及——而且不是好的那種驚喜。

關於跑分和蒸餾的提醒

說到跑分:小心。

有些第三方模型宣稱相容 Claude Code 之類的工具,提供「Anthropic 相容 API」。背後很多是通過蒸餾——大量餵入 Claude 的輸出到自己的訓練過程,模仿其行為。

2026 年 2 月,Anthropic 公開揭露數家供應商建立了超過 24,000 個假帳號,與 Claude 進行了超過 1,600 萬次對話,就是為了這個目的。

蒸餾出來的模型可能在標準化跑分上表現不錯。但跑分表現和真實使用中的可靠性是兩回事。一個記住了模式但沒有理解的模型,會在新場景中失敗——而那些正是你最需要工具幫忙的時候。

跑分告訴你模型在受控條件下能做什麼。煩躁測試告訴你它在你的條件下做得如何。

我的選擇

誠實地說明我的選擇和對應的取捨:

主力:Claude Code

框架和模型由同一個團隊(Anthropic)打造。整合深度是目前最高的。它在行動前規劃、驗證自己的產出、通過 MCP 連接外部工具。

不完美的地方:

  • 終端原生——如果你沒用過 CLI,有學習門檻
  • 費用——需要訂閱或 API 使用費
  • 地區限制——不是所有地方都能用
  • 僅限 Claude——你綁定了一個模型供應商

但對我來說,取捨是明確的。產出始終更接近我的意圖,來回修改更少,比我試過的任何其他工具都好。

替代方案:VS Code + GitHub Copilot(搭配 Claude)

當 Claude Code 不可用時,這是我推薦的組合。

VS Code 是使用最廣泛的編輯器,理由很充分——50,000+ 擴充套件、每月更新、穩定、免費。GitHub Copilot 的 agent 模式(自 VS Code 1.97 起)支援多檔案編輯、終端執行和自主規劃。因為 Microsoft 和 Anthropic 有正式合作關係,Claude 作為官方模型選項在 Copilot 中可用——整合是經過維護的,不是拼湊出來的。

你也可以在 VS Code 裡同時跑 Claude Code 的擴充套件,在一個編輯器中擁有兩種工作流程。

Copilot 每月 $10 就包含 Claude 模型存取,務實且有良好支援。

真正的重點

每隔幾個月,新工具出現,循環重新開始。新跑分、新示範、新炒作。人們追逐最新的東西,卻沒問過真正重要的問題:

這個工具是幫助我思考,還是讓我花時間去想工具本身?

最好的科技會消融在你的工作流程裡。你不再注意到它的存在。它就是能用——像呼吸空氣一樣。

這不是任何對比表格上會列出的功能。但它是唯一真正重要的。


延伸閱讀:為什麼你的下一個網站應該是 AI 原生的 | 先有框架,才能跳出框架