提示工程不是技能,
是一門每日修煉的藝術

OceanAds 設計團隊
2026 年 3 月
·
10 分鐘閱讀
AI 與科技 提示工程 AI 開發

沒有任何一位書法大師說自己「已經學會了書法」。提示工程,也是如此。

前言:「我已經學會了」,是修煉結束的錯覺

日本茶道宗師千利休晚年的弟子曾問他:「您研習茶道數十年,現在有什麼秘訣可以傳授?」千利休的回答只有一句:「燒水,點茶,喝茶。」弟子以為這是在敷衍,千利休補充說:「若你能做到完美,請來告訴我。」

提示工程(Prompt Engineering)面對的,正是類似的處境。這個領域裡有一種常見的幻覺:「我已經掌握了 prompt 技巧。」但真正深耕的從業者都知道,每一次你以為「找到了」最好的 prompt,現實就會送來一個讓它失效的邊際案例。

AI 顧問 @FaicelessC7398 在 X.com 有一段被廣泛轉發的觀察:提示工程是「與系統的每日協商,系統根據情境、token 位置和一些類似天氣的因素,對相同的詞語有不同的解讀」。這個比喻極為精準——也極為令人不安,又令人著迷。

一、為什麼「學會」提示工程是一個錯誤的目標

語言模型的行為並不完全一致。同一個 prompt 在不同情境下、在不同的對話長度中、甚至在模型更新後,可能產生截然不同的輸出。這不是 bug,這是 LLM 的本質特性——它運作在概率分布之上,而概率的本質就是「每次都不完全一樣」。

這讓許多希望找到「萬能公式」的人感到挫敗。我們習慣了「學習某個技能 → 掌握 → 可以穩定複製」的線性成長模型。但提示工程打破了這個模型,它更像是:

  • 學習烹飪:你理解了鹽的原理,但每塊魚的厚度、每天的濕度、每個爐子的火力都不同,你每次下廚仍需當下判斷。
  • 學習書法:筆、墨、紙的組合永遠在變,「以不變應萬變」的前提是對基礎的深刻理解,而不是固定的招式。
  • 學習語言中的說服:你知道什麼是修辭,但說服一個具體的人在一個具體的情境下接受一個具體的觀點,仍然是每次都需要重新判斷的挑戰。

提示工程師需要培養的,不是「一套固定技巧」,而是「持續觀察、假設、測試、調整」的科學精神,以及對模型行為的直覺感知能力。這是一種思維方式,不是一張食譜。

禪宗有「不立文字,直指人心」的說法,意指最深的領悟無法被完全文字化,只能在反覆實踐中自然湧現。提示工程中的「感」——那種知道「這個 prompt 在這個情境下不對勁」的直覺——也是如此。它不能被寫進指南,只能被修煉出來。

二、讓提示工程可測量:標準化評估框架的修煉方法論

接受了「提示工程是持續修煉」的前提後,下一個問題是:如何修煉得更有效率?

UX 設計師與 AI 開發者 @scottshapir 分享了他們的實踐答案:建立標準化的評估框架(Eval Harness),將 AI 實驗週期從 2 週壓縮至 3 天。

這個框架的核心思想,類似日本製造業中的「PDCA 循環」(計劃—執行—檢查—行動):不讓修煉停留在感覺層面,而是建立可度量的基準,讓每次迭代的效果可以被快速、客觀地驗證。

具體而言,評估框架的價值在於:

  • 讓「感覺好了一點」變成「數字好了 12%」。當你能量化改進,你才能有方向地繼續改進,而不是在黑暗中亂撞。
  • 讓知識可以傳遞。一位資深工程師對「好 prompt」的直覺無法直接複製,但一套評估標準可以讓整個團隊對齊,共同積累有效實踐。
  • 建立「提示技術債」的意識。就像程式碼有技術債,prompt 也會隨著模型更新和業務變化而老化。有評估框架,你才知道什麼時候需要重新修煉。
「基礎設施優先於功能」——工具和流程的品質,決定了創新速度的上限。一個能快速迭代的評估系統,才是 AI 產品持續改進的真正引擎。

三、本地 LLM 的啟示:換模型不如換視角

開發者 @itsdennian 的一次實測結果,提供了一個反直覺的發現:在評估本地 LLM 的摘要能力時,最大的品質躍升不是來自換用更強的模型,而是來自更好的提示工程。

這讓我想到佛教中「心外求法」與「向內行求」的對比。我們習慣於相信更大的外部資源能解決問題——更強的模型、更多的算力、更高的預算。但有時候,問題不在資源,而在我們與資源的對話方式。

莊子《秋水》篇中,河伯見到北海而驚嘆,以為自己之前的自滿是因為沒見過更大的海。北海卻說:「吾在天地之間,猶小石小木之在大山也。」——最終的視野,不是尋找更大的外部比較對象,而是找到自己在系統中的真實位置。

對提示工程師來說,這個「位置」就是:深刻理解你使用的模型的性格,學會用它能理解的方式說話,而不是不斷期待它「猜到你的意思」。

提示工程的改進,往往比模型升級更容易實施、成本更低,且效果可以快速驗證。先把現有的工具用到極致,再考慮升級——這是工匠精神,也是務實的 AI 工程哲學。

四、每日修煉的具體形態:給 AI 實踐者的行動指引

接受了「提示工程是修煉而非技能」的心態後,日常實踐該是什麼樣的?以下是幾個有操作性的方向:

建立你的「提示日誌」

就像冥想修行者記錄觀察日記,提示工程師應養成記錄有效和失效 prompt 的習慣。不求系統完整,但求真實記錄:「這個 prompt 在這個任務中效果不佳,調整了 X 之後有所改善」。累積三個月,你將擁有對自己業務領域最有效的 prompt 資料庫。

設立「評估首日」

每次開始新的 AI 功能開發前,先花半天建立評估指標——哪些輸出算「好」,哪些算「差」,用什麼方式打分。這個前期投資,會在後續的迭代過程中節省大量盲目嘗試的時間。

定期重測舊 prompt

模型更新後,過去表現良好的 prompt 可能已悄悄退化。每季度抽樣重測核心場景的 prompt,是一種技術衛生習慣,也是對系統長期可靠性的負責。

擁抱「不確定性」作為訓練場

每次 prompt 的輸出令你意外——無論是好意外還是壞意外——都是一次認識模型本性的機會。不要跳過這個困惑,在困惑中停留,觀察,形成假設,再測試。這才是修煉真正發生的地方。

你的 AI 輸出品質,是否讓你感到不穩定或難以控制?

我們協助企業建立系統化的 AI 提示工程實踐——從評估框架設計到團隊能力培養,讓 AI 輸出從「偶爾驚喜」進化到「穩定可靠」。

預約 AI 工程諮詢

結語:與不確定性共處的藝術

提示工程的本質是持續學習、持續協商。它教我們一件在 AI 時代極其珍貴的事:如何與一個你無法完全掌控的系統建立有效的合作關係。

這其實也是人際關係、組織管理,乃至一切創造性工作的核心功課。我們永遠無法完全預測另一個人的反應,無法完全控制市場的走向,也無法讓 LLM 的輸出完全服從我們的期待。

但我們可以修煉。我們可以每天比昨天更深地理解那個系統,更精確地表達我們的意圖,更有智慧地解讀它給出的回應。這種修煉沒有終點,就像千利休的茶道——燒水,點茶,喝茶,每次都是第一次,也是最後一次。

※ 本文引用觀點來源包含 X.com 公開討論及 AI 工程實踐社群分享,所有外部引用均指向公開可查證的公開內容。

延伸閱讀