同一個人、同一套想法、更差的結果
我有一個 swing trading 分析系統——偵測股票收縮型態,通過神經網路評分,輔助交易決策。最初用 Gemini 討論設計、GitHub Copilot 實現。
後來專案檔案丟了。用 Claude Code 從零重建。同一個人、同一套交易哲學、同一個偵測邏輯、同一個神經網路架構。唯一的變數是工具。
新版本在每一層都是根本性的錯誤。

Claude Code 做了我要求的每一件事。我用了 planning mode,叫它研究這個領域,詳細描述了我的哲學。它規劃、建造、測試、告訴我一切沒問題。每一層都是錯的。
不是會崩潰的那種錯。是看起來對的那種錯。收縮偵測找到了型態——只是不是我說的那些。標籤分類了交易——只是不是我思考的方式。回測產出了數字——只是不是在真正重要的場景下。
Git 歷史:4 天 29 次 commit,12 次是重寫或修正。 我 95% 的時間不是在建造,是在驗證——逐層檢查輸出是否符合我的意圖。
我找到舊程式碼片段,請 Claude Code 比較。結果令人難堪。它逐個功能、逐層走了一遍兩個版本——每一個元件,舊設計要麼更完整,要麼考慮得更周到,要麼處理了新版本根本不知道存在的場景。
缺失的碰撞
顯而易見的反應是「你應該多討論」。我做了。Claude Code 有 planning mode,我用了。我也叫它研究這個領域。都沒有解決問題。因為問題不在工具有沒有規劃,在於工具認為規劃是什麼意思。

跟 Gemini 討論時,對話是一場碰撞。我提出偵測方法,Gemini 分析。我反駁——「如果收縮中途跳空下跌怎麼辦?小盤股的壓縮方式不同呢?如果板塊正在輪動出場呢?」——同時針對每種情況提出解決方案。Gemini 壓力測試我的方案,找到我沒看見的漏洞。我修正、重新提案、繼續爭論。有時候一個組件就來回好幾個小時,直到雙方都找不到可以打破的地方。
那場碰撞迫使我把自己都不知道是隱性的直覺外化了。每次爭論都把又一片拼圖從我腦中轉移到共享的理解裡。到動手建造時,AI 有了足夠的碎片來拼出我的圖。
Claude Code 的規劃不同。它聽、它組織、它確認、它執行。非常擅長把清晰的需求轉成可運作的程式碼。但它不會挑戰需求背後的假設。它信任你說的,圍繞它規劃,然後建造。落差:理解你說了什麼,和理解你是什麼意思。
建一個登入頁面,你說的和你意思的是同一件事。建一個交易系統——「正確」意味著反映 15 年對市場行為的直覺——那個落差就是一切。
信心陷阱
還有一個更深的問題。工具會驗證自己的成果。它測試、分析輸出、告訴你是正確的。回測出 65% 勝率,它說「結果看起來合理」。
那份信心讓你付出代價。你信任輸出、繼續推進、投入時間——直到你手動逐層驗證時才發現問題。用舊的流程,驗證幾乎不需要。設計碰撞夠徹底,實現自然就反映了我的意圖。我不需要檢查,因為思考已經完成了。
我不在意交易系統最終是否賺錢——那取決於市場和執行。我在意的是保真度:輸出是否符合我的想像?一個完美建造了錯誤東西的工具,比一個粗略建造了正確東西的工具更糟。
創造的浪漫
人們愛說「think outside the box」。但他們忘了:你首先需要有 box。
這個 box 是你的理解、你的領域知識、你多年觀察的累積。沒有 box,就沒有 outside——只有隨機。某些隨機是好的——意想不到的連結和意外的驚喜是跟 AI 合作的禮物。但當所有東西都是隨機的,當輸出跟你的理解毫無錨點,它就不再是創造。它是恰好能編譯的噪音。

尼古拉·特斯拉理解這一點。他在 1919 年寫道:
「當我有了一個想法,我會立即在想像中建造它。我修改結構、做出改進、在腦中操作這個裝置。對我來說,在思想中運轉渦輪機還是在工坊中測試,完全沒有區別。」
他在腦中建造、測試、完善——只有當心中的藍圖完美無缺時,才會製造實體的機器。二十年,從未有過例外。
這正是 AI coding 工具跳過的部分。它們直接跳到機器。機器能跑——但那不是你的機器。那是用 AI 手上的碎片拼的,不是用你腦中的碎片。
藍圖不是你給 AI 的描述。是那個完整的心智模型——經過測試、壓力測試、通過碰撞而精煉——在你描述任何東西之前就存在於你腦中的。建造它需要深度思考那種緩慢的、混亂的、不舒服的工作,沒有 planning mode 能替代。
創造的浪漫不在於看機器運轉。在於那段讓機器成為必然的思想之旅。
有時候,用 AI coding 工具最有生產力的事,是拒絕寫程式碼——先踏上那段旅程。