某天我看到一篇新聞,提到透過AI(人工智慧)幫助某項護理工作減少時間,能夠將原先的工作5分鐘時間減少至2分鐘,我不禁莞爾一笑~就我所知,那項護理工作在我熟知的醫院中,一般來說就只要2分鐘,你沒有看錯,就是2分鐘,甚至就是以2分鐘做為指標,來規範該醫院的護理師達到這件事,或許是每間醫院的狀況不一樣,但是AI的神話有時候也讓我在工作上覺得很困擾,寧願相信AI可以解決任何事。
這裡就要從智慧醫療在台灣如何開始說起,在台灣智慧醫療計畫起源試辦時間約莫2007年與2008年行政院就開始推動了[1],包含RFID應用、電子病歷、與健康資料庫的應用等計畫[2],筆者認為這些項目是非常務實且推行到現今有幫助的計畫,除了遠距醫療因為醫療法規上較難推行外。
智慧醫療在台灣再次被探討與定位的時間應該是在2016年,有興趣可以搜尋國家發展委員會委託台灣大學研究的「智慧醫療關鍵議題與對策之研究」內容,其內容是比較各國智慧醫療推行的狀況,並且組成大量專家學者,其主軸定位在遠距醫療、智慧照護、智慧醫院與醫療AI[2]。
新聞上開始報導大量智慧醫療,讓智慧醫療變成顯學,大概是AIphaGO在2017年打敗職業棋士柯潔後,也開啟AI大智慧時代,任何事情套上"AI"或是"智慧"兩字,變成商業上行銷的手段,涉及範圍包含資通訊、自動化、影像辨識、大數據,只要涉及就能加上"智慧"兩字、加上"AI"的條件就是只要電腦幫你做選擇甚至只是自動化都說是"AI",所以這裡的"AI"就是泛指那些說自己是"AI",並且以我看過的內容做為依據,當然可能對於某些人來說並不是,會認為就是現在討論的大數據(其實更原始名字是數據科學),也就是分類器(這裡泛指分群分類的數據處理方法),當然如果能夠幫助他人,甚至是對於醫院有幫助,名字夠炫炮也是好事,因為這是商業化的第一步,取個好名字,但是最怕的就是用途不佳,又開始大力宣傳,浪費許多金錢與時間。
現今在智慧醫療風潮上,大家都想要搞"AI",如果想要了解有哪些正在執行的大量"AI"題目,可以去看AIGO計畫網站[3],並沒有推薦各位參與,是可以看看審視通過的計畫有哪些,而這裡提供幾個判別醫療"AI"是否有用的方法,可以去網站自己評估看看。
1."AI"需要的資料是否完善?
醫療"AI"的用途大項目分成幾種,醫療影像辨識、預測、演算法、自然語言與語音辨識,這幾個方向在醫療領域上都是有陸續延伸與研究。
例如:各種AI影像辨識XX疾病,告訴你多少準確率;專門在比拚預測準確度的比賽像是kaggle[4];演算法則是在醫療數據分群、分類或是最佳化後應用於醫療;自然語言與語音辨識則是在於AI客服機器人,亦或是語音輸入病歷等等,原因還是在資料蒐集的狀況,資料需求格式與資料量是最主要的重點,所以以這幾項AI影像辨識現今要準確度高,只有人工標記的方式,人工標記的影像數量不足就無法應用;大數據顧名思義需要大量的數據,預測則非常需要大數據與專家知識的補足,才能知道今天是哪個關鍵因素影響到這些狀況,導致未來病患增加,或是醫材短缺;演算法如果沒有適當的數據與專家知識的輔助,並且資通訊設備補齊,演算法就會像是玩具一樣好玩而已,像是推薦哪位醫師看診,亦或是找停車場空位,缺乏任一條件皆會導致推薦誤判或是無法使用;自然語言與語音辨識,我認為自然語言的部分需要仰賴語言專家的知識去標記詞性的資料,才能獲得足夠的辨識率並達到應用階段,語音辨識則是聲學方面的研究,這部分難度在於需要大量且重複語句的聲音檔案去進行AI訓練,且會因為不同口音語法而導致辨識錯誤,雖然辨識錯誤能夠建構資料庫去修正,但每個單詞都需要建構一系列相似詞的資料庫去修正是不易的,現今大多數是透過大公司的工具直接應用,並建構資料庫去修正,並且單詞指令式的使用是最沒問題的,若要可以溝通回應,需要是個人使用並建構個人資料庫去修正,或者是訓練人的說話方式配合語音辨識,提升辨識率。
2."AI"辨識率或是預測精準度是否足夠應用?
辨識率與預測精準度,第一前提是上述資料的完善程度,加上資料前處理與標記的精準度,尤其圖像與聲音會因為資料庫的種類影響很大,例如:不同方向的圖片或是不同國家的口音,都會影響到辨識率與預測精準度,這也是深度學習的痛點。
舉例來說:目前AOI自動光學檢測設備,一開始需要花費大量時間標記辨識規則與規範光線的狀況等,以達到辨識率99%,但這是仰賴人工的方式調整參數、定義規則與規範使用場域的結果,並且需要定期修正、除錯與調整參數。另一方面AI圖像辨識相較之下沒有上述問題,只需有資料集丟入模型訓練,就無需仰賴人工且適用場域廣泛,但是當模型建立完成後,辨識過程是無法被干涉。因此辨識率非常仰賴資料的狀況,目前正在研發與建構的方式為AOI結合AI的方式,可套用至其他場景以達到真正產品可靠度的提升。
回到辨識率與預測精準度,這兩項在醫療領域上是非常重視的,現今普遍社會觀點依舊是信任醫師的專業判斷,AI辨識只是輔助的狀況,不管預測精準度達到多少,若沒有解放醫生並完全依據機器判斷,AI辨識就沒有使用的必要性,除非醫生本身看診判斷比AI辨識率低很多,即存在必要性,因此辨識場景很重要,若今天需要辨識的狀況為人眼的極限,可能速度快、容易疲憊與細小不易確認的病徵影像,連醫護人員都難以辨識,此時使用AI進行影像辨識就極其重要,例如:半導體生產狀況,在沒有相應的檢測設備下,透過AI預測進行排程,或是細微之病理資料,人眼不易查找的狀況,但是不容易不代表沒辦法,人眼無法做到交疊狀況數量的清點辨識,舉例來說,橘子交疊一起,只露出部分,是無法猜出後面有沒有,如果不同種類相似的水果,儘管標示出來,但是交疊的狀況將特徵遮蔽,就會造成無法辨識出的狀況,目前還無法有效克服,因此這部分還是取決於資料,像是病理資料是3D圖像資料,病徵細微而不清楚,需要花費大量時間尋找,因此若是水果也能3D成像,只要能擷取特徵,辨識就不成問題。
預測方面,在醫療上,最困擾的還是非預期的狀況,例如疫情的當下,預測因外在因素而改變,回到目前預測的兩種方式,一種是考慮外在因素,另一種僅考慮頻率,像是心電圖適合使用心電頻率評估病患情形,不管是甚麼方式,當涉及到醫學疾病辨識上不管是心電圖資訊或是疾病圖像辨識,若是沒有達到95%以上,並且在有醫師擔保預測是準確的情形下,使用者還是會有疑慮,而時間預測上若沒達到85%~90%準確率,是會被病患或是醫護人員不信任,導致預測資料無法配合改變資源配置或是行動措施。
自然語言與語音辨識面臨辨識速度慢與辨識率低的問題,若是要解決又需要大量的標記資料,如果不是完成品,則醫護人員在應用上出現上述問題,就會瞬間棄用,尤其是講求效率的急診醫護人員來說,更是沒有足夠的時間測試沒有完備的方案,因此若是速度上無法比起原先醫療作業方式還要快速,並且辨識率沒辦法達成95%以上,就不是一個好的解決方案。
演算法需要的是提供有感的解決方案,沒有達到改善比率的10%都不是一個好的解決方案,所以更看重的是主題、情境與目標值,這部分可以分享的內容很多,後續文章再跟各位分享。
3."AI"是否真的商品化並且大賣?
為什麼大部分的醫療"AI",並沒有在任何一個地方廣泛的應用,如同車牌辨識或是人臉辨識已經是很生活化的產品,最主要還是辨識率不足以達到理想使用情境中的"病患的需求",目前醫療"AI"沒有產品性能能夠達到取代醫師的程度,因為"病患的需求"非常的難達標,台灣"病患的需求"叫做主觀的100%的名醫思維,若是沒有名醫背書,那醫療"AI"就只是實習醫師看診的信任程度甚至更低。當病患看診認知到自己得到絕症,會寧願看好幾個名醫總結出自己的答案,不會相信醫療"AI"準確95%的事實,而是相信多個名醫給你的回饋,因此主軸放在辨識率要達到"病患的需求"是有難度的。
因此這裡就要談到另外兩個需求,醫護人員的需求與醫院院方的需求,醫護人員需求是工作作業上變輕鬆或是負擔減低,醫院院方的需求是降低成本與提高利潤,因此如同前述,醫護人員需求如何滿足呢?就是提高流程作業效率與減少不必要的浪費,而醫院院方需求如何滿足呢?就是評估醫療"AI"成本與後續回饋金額,筆者認為上述這兩項需求是醫療"AI"成功商品化與大賣的關鍵,純粹就是找到好的應用場景,創造出好的應用場景,這部分如何實現會再後續跟各位分享。
第一次在部落格分享,歡迎訂閱此專欄,並交流不同的想法,不吝給予賜教,謝謝你們。
參考資料