什麼是 Tag?為什麼要人工 Tag?
在工業 OT 世界裡,Tag 就是給感測器吐出的數據貼標籤,讓這些冷冰冰的數字變成 AI 或系統能懂的「話」。
比如,一個感測器吐出「32768」,這什麼意思?沒人知道!工程師得手動標記:- 「這是馬達 #3 的電流」
- 「2025/10/28 14:32:17」
- 「單位 mA,正常」
有了 Tag,AI 才知道這筆數據是誰、什麼時候、說了什麼,不然就是一堆亂碼。
為什麼要人工 Tag?
簡單來說,傳統工廠的感測器很「笨」,只會吐數字,沒自帶「身份證」(像設備 ID 或時間戳)。不像現代方案(比如 vCAN)能自動標記,過去的 SCADA、PLC 系統得靠人手幫忙「翻譯」。
- 數據混亂:工廠有上千個感測器,電流、溫度、轉速混在一起,沒 Tag 就像沒名字的包裹,AI 完全抓瞎。
- AI 需求:AI 要結構化數據(像「異常/正常」),但感測器不會自己喊「我壞了」,得靠工程師判斷。
- 歷史遺留:老系統設計時沒考慮 AI,資料流進來亂七八糟,只能靠人工整理。
問題在哪?
人工 Tag 又慢又容易錯:
- 延遲:標籤常滯後幾秒到幾分鐘,AI 不一定拿到即時數據。
- 主觀:不同工程師標準不一,有人標「正常」,有人標「異常」。
- 失真:為了省事,數據常被平均化,細節(像 0.3 秒電流暴衝)全丟。
這就像請個英文很爛的翻譯官,AI 學到的全是錯話,直接呼應《當 AI 學會說謊》的痛點:假資料讓 AI 說謊!
Tag 流程:從感測器到 AI 的「翻譯之路」
人工 Tag 的流程就像工廠流水線,但漏洞百出:
- 感測器吐數據:馬達感測器輸出電流值(像 32768),或溫度(45.3°C)。
- 數據進系統:透過 IO 模組、閘道器,傳到 SCADA 或資料庫。
- 工程師標籤:
- 標設備 ID(「馬達 #3」)。
- 加時間戳(「2025/10/28 14:32」)。
- 判斷狀態(「正常/異常」)。
- 有時還得換單位(像 ADC 值轉 mA)。
- 整理入庫:Tag 好的數據存進資料庫,供 AI 分析。
- AI 訓練:AI 拿這些標籤數據,學模式、做預測(像預測馬達壽命)。
聽起來順,但問題多:
- 效率低:上千筆數據,手動 Tag 累死人。
- 不一致:不同工程師標法不同,AI 學到亂七八糟。
- 沒審計:Tag 完沒人檢查對不對,錯了也沒人知道。
Tag 工程師好比翻譯人員:誰來檢定英語級別?
如果把 Tag 工程師當「翻譯官」,他們的「英語級別」(專業能力)怎麼定?
就像英語有 CEFR(A2 到 C1),Tag 工程師也該有等級,但現在完全沒標準!
讓我們來模擬一下 Tag 工程師的認證等級,對照語言認證:
- L1 初級(CEFR A2,多益 500 分):
- 能力:會看儀表,標簡單 Tag(「馬達 #1 溫度」「正常」)。
- 場景:工廠技工,負責貼基本標籤。
- 問題:看不懂複雜波形(像 0.3 秒電流暴衝),標錯很常見。
- L2 中級(CEFR B2,多益 800 分):
- 能力:懂波形分析,能標複雜 Tag(「軸承磨損」「啟動尖峰」)。
- 場景:資深工程師,懂 PLC 和製程。
- 問題:壓力大時偷懶,平均化數據,細節丟失。
- L3 高級(CEFR C1,多益 950 分):
- 能力:能提煉特徵(像振動頻譜),設計自動 Tag 規則,監督品質。
- 場景:數據科學家或系統架構師。
- 優勢:標籤精準,支援審計,但這種人超稀有。
誰來檢定?
- 現狀:沒人管!工廠隨便抓個技工就開始 Tag,沒認證、沒標準。
- 理想:
- 國際組織:像 IEEE 或 ISA,推「工業數據標記標準」,考試分理論(OT 知識)和實操(標記波形)。
- 第三方:像 TÜV 或 SGS,審計 Tag 品質,發 L1-L3 證書。
- 企業內部:大廠自建培訓,定內部標準。
行業專業性怎麼看?
- OT 知識:懂 PLC、PID、製程(像馬達啟動邏輯)。
- 數據分析:會用 Python、MATLAB 看波形,懂時間序列。
- 審計能力:能留版本號,確保 Tag 可重算(呼應你的「可審計數據治理」)。
現在的問題是,90% 的 Tag 工程師只有 L1 水平,標籤品質慘不忍睹!
不同級別的 Tag 工程師:AI 能發現誰的資料不真實?
假設一家工廠有三個 Tag 工程師:
- L1 小明:新手技工,只會標「正常/異常」,常把 0.3 秒電流暴衝標成「正常」。
- L2 小強:資深工程師,標「軸承磨損」,但忙起來直接平均數據,細節丟了。
- L3 小智:數據專家,標「電流暴衝因軸承問題」,還附波形分析。
AI 照單全收,這三人的數據混在一起,AI 能發現誰的不真實?
答案:很難!
- 為什麼?
- 沒審計機制:傳統系統不存原始數據(不像你的 EDC 黑盒),AI 只能信 Tag,沒法回頭查真相。
- 混亂輸入:L1 的錯誤 Tag(「正常」)、L2 的模糊 Tag(平均值)、L3 的精準 Tag 混在一起,AI 學到一團亂,輸出「幻覺」(像誤判馬達壽命)。
- AI 不懂懷疑:現在的 AI 模型(像神經網絡)只看輸入數據的模式,沒能力判斷「這 Tag 是假的」。
- 什麼情況能發現?
- 如果有你的 L1 黑盒層(像 vCAN + EDC),存原始波形,AI 能比對 Tag 和原始數據,發現 L1 小明的「正常」是錯的(因為波形有暴衝)。
- 如果有 L2 清洗層,留版本號,AI 能回溯 L2 小強的平均化操作,看到他把 0.3 秒異常抹平了。
- L3 知識層 要求簽章,L3 小智的 Tag 會附證據(波形 + 分析),AI 能優先信他,過濾小明、小強的爛 Tag。
現實慘況:
沒 vCAN 和 EDC 的工廠,AI 只能吃「爛翻譯」,完全分不出誰的 Tag 是假的。就像你文章《當 AI 學會說謊》說的:假資料進,謊言出!
結語:Tag 亂象讓 AI 說謊,解法在你手上
人工 Tag 是工業 AI 的痛點:
- 亂:沒認證標準,L1 到 L3 水平參差不齊。
- 假:錯誤 Tag、平均化讓 AI 學假象。
- 盲:AI 照單全收,分不出真假。
你的「可審計數據治理」(L1 黑盒、L2 清洗、L3 知識)完美解決:
- vCAN 讓感測器自帶 Tag,解放技工。
- EDC 存原始數據,可回溯查錯。
- 三層架構讓 AI 只學真資料,拒絕謊言。
一句話總結:
「Tag 工程師沒標準,AI 只能學假話。給我 vCAN + EDC,AI 保證說真話!」



















