Sabrina Kao是認識多年的朋友,在我就職CPC(中國生產理中心)時,就前往美國深造,獲得醫藥護理學方面的博士學位,也任教於德州的某大學的教職,前一陣子我將我的部落格連結給Sabrina,引起Sabrina的興趣,產生了一小段的對話如下:

GaryQ9000: 連結NO44. AI時代來臨-田口品質工程與AI合作的契機
Sabrina: 最近在我領域中最熱門的也是AI在健康領域(臨床丶教育丶甚至考執照)的應用。
Regression model亦是我研究統計中常用的。
GaryQ9000: 你應該用Logic Regress吧!
Sabrina: 看依變項是什麼性質的。若是類別性的(如有/無)就用logistic regression;
若是連續變項(如有數字的)就用multiple regression. 我博士論文就是在’預測’何種中風老人會被送到護理之家。
GaryQ9000: 我工作上用比較多的是工業統計-(田口SN比分析)的實驗設計法。我的部落
格就是分享這方面的經驗。
GaryQ9000: 連結NO45.田口品質工程』各步驟重要優先次序觀點
Sabrina: 參數是統計中的parameter 吧!而noise應是miss或有時稱為extraneous
variable. 例如我碩士論文測量手術後第一次下床時血壓的變化時,當時未考
慮到台大舊大樓並無暖気(只有窗型冷氣)而室溫也會影響血壓值。所以日後
皆控制只在室溫15 -20度時收案(因爲是秋冬季)?
GaryQ9000: 以ANOVA分析的DOE妳的觀點是是的!但田口方法是SN比分析和Noise設定
(參數-控制因子在内側直交表;Noise因子(例季節室溫變化大)在外側直交
表)→田口DOE是找一組最適參數組合,不但可以抵抗Noise(對Noise不敏
感)也可以找到合適輸出值 。
例如我部落格中,紙飛機✈️實驗,Noise是紙飛機老化(弄溼)+逆向風。然
後紙的材料、導流、重心片材質、重心片位置⋯等控制參數最佳組合。不但
可以讓紙飛機✈️飛向目的,也同時抵抗noise。這個S N比的實驗設計是日本人田口博士
(Dr. Taguchi)創造的方式。就是我這三十多年的工作項目之一。

GaryQ9000: 部落格的內容就是描述這個方法, 它大部分都在研究工業制程工藝的優化。例
如半導體製程、印刷電路板工藝、電子組裝工藝、汔車零件生產技術工藝⋯。
Sabrina: 聽起來像regression Y=alphaX1+alphaX2+alphaX3…. ANOVA只能用在同一變項
有二組以上的比較(e.g., X1, X2, 或X3). 如重心片放在三種不同位置,但無法
同時測重心片不同材質。這時就要regression了。
GaryQ9000: 感覺不太像Regress,(但也可以用-元、二元、多元regress進行建模評價)。
Sabrina: 應該是Multiple regression !
GaryQ9000:請參考我部落格的紙飛機實驗(上)(中)(下)
No-38透過『自然科學遊戲-紙飛機設計(Activity)』進行Taguchi實驗計畫(上)
No-39透過『自然科學遊戲-紙飛機設計(Activity)』進行Taguchi實驗計畫(中)
No-40透過『自然科學遊戲-紙飛機設計(Activity)』進行Taguchi實驗計畫(下)
GaryQ900: 主要是這方法的Noise 概念 跟ANOVA 的方法不同, 你是學者,只要你上網研讀一下它
的方法就知道了,我是透過長年的案例累積
Sabrina: 我也教博士班統計,所以很多東西到我腦中都會變成統計。
GaryQ9000: 統計真的很有用,像現在的AI 中的建立預測模型(Building a Predictive
Model),再透過M.L. 與D.L.進行預測,他就是透過大量的統計模型(線性回歸 /
非線性回歸/Logistic回歸/多項式回歸/ 逐步回歸…..以及更多其他預測模式
演算法)
Sabrina: 但有些資料後的聲音會被忽略了,這就是為何近年來博士論文移至mixed
method(量性&質性一起做)但能做好兩者的並不多。他們往往需要研究者的不
同人格特貭,就像iOS與Android一樣。
GaryQ9000: 量性&質性一起做=>Logic Regress, 當然研究醫學(病人)就非常複雜
(患者的意志力,個性,基因.....)。相對於醫學研究, 我們工業統計在統計數學
上相對比較簡單。
Sabrina: 不過Logistic regression 仍是量性用於類別式的依變項。在人類研究中,不
管是何種貭性研究都要透過會談,所以談不了太多人(通常15個以下)就會
data saturate了(談來談去都是已經談過的時,就該停止談下去了),再由
訪談內容中找出共通的主題。
GaryQ9000: 我研究或者輔導的對象就是工廠(鋼鉄、電子、化工、汔車供應鏈)妳研究的對象是患者是
醫護機構, 可能用到的統計方法不太一樣!

















