
程式語言是與機器溝通的邏輯,但自然語言是與 AI 共舞的藝術。
我是中文系畢業的數據工程師。
多年前,當我跨越學科的鴻溝,從文學轉身投入數據領域時,曾深陷於「冒牌者症候群」的焦慮。在講究精確邏輯與演算法效率的工程世界裡,我一度以為必須拋棄過往對文字的敏銳感知,才能習得機器運作的冰冷法則。
然而,隨著生成式 AI 的技術奇點來臨,我重新審視了這段歷程。事實證明,在人工智慧的時代,人文學科所強調的「語意理解」與「文本考據」,不僅未被淘汰,反而是駕馭高階智能的核心代碼。
數據清洗:現代版的「校勘學」
在數據工程的實務中,我們常需面對龐雜、格式不一甚至充滿謬誤的原始資料。傳統工程視角往往將其視為需被過濾的「髒資料」(Dirty Data),但在我看來,這與中國傳統的「校勘學」有著異曲同工之妙。
研讀古籍時,面對傳抄過程中的「魯魚亥豕」之誤,學者不能僅憑直覺刪改,而必須根據「上下文語境」(Context)進行推敲,還原作者原意。
數據治理亦然。當數據出現異常,純粹的邏輯判斷容易導致資訊流失;而具備人文素養的數據工作者,能像考據學家一般,洞察數據產生的業務情境,判斷這是人為疏失、系統誤差,抑或是某種特殊商業行為的訊號。
數據思維(Data Thinking)的本質,不只是計算(Calculation),更是理解(Comprehension)。
人文訓練賦予了我們對「文本不確定性」的解析能力。在混亂的資訊中梳理脈絡,從雜訊中提取訊號,這正是處理真實世界數據(Real-world Data)最稀缺的洞察力。我們不只是數據的清理者,更是數據的校勘者。
提示工程(Prompt Engineering):數位時代的「煉字」藝術
如果說數據處理是對過去的考據,那麼生成式 AI 則將「修辭學」轉化為未來的生產力。
過去,人機協作依賴的是電腦語言(Syntax),對語法有著嚴苛的邏輯要求。然而,隨著大型語言模型的普及,自然語言(Natural Language)已晉升為最高階的程式語言。
這標誌著核心競爭力的轉移:問題不再是「如何寫出電腦能執行的代碼」,而是「如何精準描述人類的意圖」。這正是中文系經年累月訓練的技藝——「煉字」。
古人云「吟安一個字,撚斷數莖鬚」。在與 AI 協作時,一個形容詞的精確度、一段指令的結構邏輯,往往決定了產出的品質是平庸還是卓越。具備深厚文字底蘊的人,能運用精準的詞彙與嚴謹的邏輯框架,引導 AI 突破模糊的邊界,產出兼具深度與靈魂的內容。
在 AI 時代,我們不僅是使用者,更是「AI 總編輯」。我們以品味為準繩,以邏輯為經緯,指揮算力進行創作。
科技:新時代的筆墨
撰寫本文,旨在為處於職涯十字路口的人文背景者提供一種新的視角:技術並非人文的對立面,而是其延伸。
自動化工具與演算法,本質上是現代的筆墨紙硯。它們將我們從重複性的勞動中解放,使我們能專注於更具價值的思想建構與策略規劃。
我始終認為自己是一名文人,只是我手中的筆,換成了能用數據敘事、用演算法寫詩的工具。如果您也渴望在數位浪潮中找到人文的錨點,歡迎來到我的沙龍「演算法人文學」。
在這裡,我們將一同探索如何以理性的數據思維,解構感性的商業與文本世界。
勇於跨界的人先享受世界;而懂數據的文人,將定義這個新世界。










