如何選擇 Vibe Coding 工具（不讓自己抓狂）

噪音

Andrej Karpathy 在 2025 年 2 月提出了「vibe coding」——用對話引導 AI 寫程式，而不是自己逐行撰寫。這個概念引起了共鳴，市場隨之爆發。現在的 AI coding 工具多到沒有人能合理地逐一評估。

但這不是真正的問題。

在 AI coding 工具的噪音中找方向

真正的問題是，你在網上找到的大部分內容——教學、示範、「5 分鐘搭建 X」的影片——都不是真正在做開發的人做的。他們在建登陸頁面、待辦事項 app、行銷文案生成器。一樣的淺層示範，反覆循環。

你看了，試了，心想*「嗯，還行」*。然後就沒有了。不清楚這些跟你的實際工作有什麼關係。不理解為什麼同一個 prompt 在某個工具裡表現很好，換一個就變成垃圾。

這個落差——示範和現實之間——就是大部分人卡住的地方。

唯一重要的區別

大部分的工具比較都在看功能：自動補全、對話、agent 模式、模型選擇。這些都是表面的。

真正能預測你使用體驗的區別是：框架和模型的耦合程度有多高？

每個 AI coding 工具都有兩層：

框架——你互動的介面。它負責檔案存取、專案上下文、規劃、指令執行和工作流程。
模型——負責推理、寫程式和做決策的 AI。

有些工具把這兩層綁在一起，有些讓你自由搭配。這兩種架構之間的選擇，決定了一切。

框架與模型：每個 AI coding 工具的兩層架構

方式	例子	取捨
緊密耦合	Claude Code（僅限 Claude）	選擇少，最佳化深
鬆散耦合	OpenCode（75+ 模型）	選擇多，整合淺
中間路線	GitHub Copilot（GPT、Claude、Gemini）	精選模型，官方合作

當框架和模型一起打造時，每個互動都經過最佳化——系統提示、規劃步驟、錯誤修復、上下文的收集和回饋方式。框架知道模型如何思考。

分開的時候，框架發送通用 API 呼叫，然後祈禱結果好。能用，但有上限。

舉個具體的例子。Claude Code 在寫任何程式之前，會進入規劃階段：讀取你的專案結構、追蹤 import 鏈、檢查現有測試模式、映射依賴關係。然後才開始修改。這個工作流程存在的原因是框架圍繞 Claude 的推理方式而設計——它知道 Claude 在有充足上下文時表現更好，所以自動收集這些上下文。

一個通用框架透過 API 使用同一個模型，不會做這些事。它不了解 Claude 的偏好，只是發送 prompt。

煩躁測試

真正的測試發生在實際工作中

這是我選擇工具的實際方法。很簡單，但比任何跑分都可靠。

用這個工具做幾個小時的真實工作。注意你的感受。

不是看產出「厲不厲害」，不是看它處理精心設計的示範好不好。而是你在工作時的感受。

如果你開始覺得煩躁——工具沒聽懂你的意圖、走偏了方向、寫出你絕不會寫的東西、或者需要三次追問才能修正——這就是信號。

工具無法銜接你的思考和它的產出。

一個好的 AI coding 工具應該像跟一個能力出色的同事合作。你描述目標，它想出方法。你檢視和調整。這個循環應該感覺自然，而不是在搏鬥。

這直接對應 deTrouble 的原則：科技應該減少摩擦，而非製造摩擦。 如果一個工具增加了認知負擔——你花更多精力在管理工具而不是做事——那它就失敗了，不管跑分多好看。

煩躁測試同時也揭示了整合深度。緊密整合的工具讓你更少煩躁，因為框架能預判模型的行為。鬆散耦合的工具更容易讓你措手不及——而且不是好的那種驚喜。

關於跑分和蒸餾的提醒

說到跑分：小心。

有些第三方模型宣稱相容 Claude Code 之類的工具，提供「Anthropic 相容 API」。背後很多是通過蒸餾——大量餵入 Claude 的輸出到自己的訓練過程，模仿其行為。

2026 年 2 月，Anthropic 公開揭露數家供應商建立了超過 24,000 個假帳號，與 Claude 進行了超過 1,600 萬次對話，就是為了這個目的。

蒸餾出來的模型可能在標準化跑分上表現不錯。但跑分表現和真實使用中的可靠性是兩回事。一個記住了模式但沒有理解的模型，會在新場景中失敗——而那些正是你最需要工具幫忙的時候。

跑分告訴你模型在受控條件下能做什麼。煩躁測試告訴你它在你的條件下做得如何。

我的選擇

誠實地說明我的選擇和對應的取捨：

主力：Claude Code

框架和模型由同一個團隊（Anthropic）打造。整合深度是目前最高的。它在行動前規劃、驗證自己的產出、通過 MCP 連接外部工具。

不完美的地方：

終端原生——如果你沒用過 CLI，有學習門檻
費用——需要訂閱或 API 使用費
地區限制——不是所有地方都能用
僅限 Claude——你綁定了一個模型供應商

但對我來說，取捨是明確的。產出始終更接近我的意圖，來回修改更少，比我試過的任何其他工具都好。

替代方案：VS Code + GitHub Copilot（搭配 Claude）

當 Claude Code 不可用時，這是我推薦的組合。

VS Code 是使用最廣泛的編輯器，理由很充分——50,000+ 擴充套件、每月更新、穩定、免費。GitHub Copilot 的 agent 模式（自 VS Code 1.97 起）支援多檔案編輯、終端執行和自主規劃。因為 Microsoft 和 Anthropic 有正式合作關係，Claude 作為官方模型選項在 Copilot 中可用——整合是經過維護的，不是拼湊出來的。

你也可以在 VS Code 裡同時跑 Claude Code 的擴充套件，在一個編輯器中擁有兩種工作流程。

Copilot 每月 $10 就包含 Claude 模型存取，務實且有良好支援。

真正的重點

每隔幾個月，新工具出現，循環重新開始。新跑分、新示範、新炒作。人們追逐最新的東西，卻沒問過真正重要的問題：

這個工具是幫助我思考，還是讓我花時間去想工具本身？

最好的科技會消融在你的工作流程裡。你不再注意到它的存在。它就是能用——像呼吸空氣一樣。

這不是任何對比表格上會列出的功能。但它是唯一真正重要的。

延伸閱讀：為什麼你的下一個網站應該是 AI 原生的 | 先有框架，才能跳出框架