事情是這樣的…
薯條父因為心臟有動過刀,血壓測得比較頻繁,血壓機他一用就會測個五六次,而且是早中晚各五六次。如果有一兩筆比較誇張的值(過高或過低)可能會剔除掉,所以薯條父累積了一大堆數字,之後要抄到自己的筆記本上,又要在快要回診前把大量的數字抄到正式的醫療紀錄本上並且補上平均動脈壓(Mean arterial pressure,簡稱MAP)的數字,薯條父本來就是一個龜毛又辦事效率極差的人,所以當他心情不好時,薯條就很容易遭殃或是被情勒(?)。
契機
大概在2025年4月左右的時候,我就覺得生成式AI的品質有在逐漸上升,然後慢慢寫了小說01,過程當中突然想到了網路上吹了很久的Vibe coding,於是薯條想到了靠著與AI對談能不能寫出一個私人用的手機app?APP預計要有以下功能:
- 可以用鏡頭對血壓機螢幕拍照
- 抓出指定數字後計算MAP數值
- 歷史紀錄功能(表單樣式)
想了想之後,覺得好像很難,光是OCR文字辨識就不知道要怎麼執行了,薯條可是一個完全不懂程式語言的馬鈴薯加工品,但那時的生成式AI讓我感覺有些可能性,於是薯條還是硬著頭皮上了。
嘗試
於是薯條就開始安裝了 Android Studio ,打開後,光是初始介面就是有看沒有懂,一堆選項,還有要選擇第幾版的Android 之類的,好在薯條就是一直截圖跑去問AI。那個時候使用的是Grok3,採用原因是若GPT使用次數過多的話,會降至比較低等的模型,如果是Grok3 次數到了直接停用,沒有品質降低的問題。花了很多時間後終於可以開始寫程式碼了。
當然薯條也沒寫什麼程式碼,只是叫grok給我程式碼之後,丟到 Android Studio執行,然後出錯,反問grok,如此搞了三四天之後,我發現有些錯誤根本是在鬼打牆,於是夢就醒了。
轉機
很快,居然已經2026年了,gemini 3更好用了,薯條感受到了科技的進步,當然該出錯的時候還是會錯。於是那個要做小程式的想法再度冒出,但是這次的想法精簡很多「可以在網頁上執行MAP計算的計算機」,這次我選了gemini來製作這個app,大概花了一個晚上弄出了一個陽春的功能,canvas模式中測試完之後發現可以用,gemini還叫我丟到google協作平台。天啊,一個能用的小東西就出來了,超爽,腦中多巴胺大量的分泌。

這個web app的介面長這樣。

介面與版塊又大又簡潔,太適合長輩了(偏見拉滿)。於是我就把這東西塞進薯條父的手機裡了,直接按5次數字(收縮壓3位數、舒張壓2位數)就有MAP的數字出來,比按傳統計算機快多了,才剛試用兩天,目前沒聽到抱怨。
結尾
好了,那麼文字辨識版怎麼辦呢?
薯條仔細想了想薯條父的作業流程,發現是先排除極端值後,才寫在筆記本上再統一轉到醫療紀錄本補上MAP的話,文字掃描系統是沒必要了,目前這個版本就不錯用了,太科技的東西甚麼表單化之類的,老古板的薯條父是不願意學習的。(如果換成是我,就直接表單化給醫師看我的平板了,還可以用google試算表配合數值底色變化給醫師看勒,前提是醫師也能接受的話)
基於上述考量之後,我就把文字辨識版本做出來了。
支離破滅的思考、邏輯與發言,是這樣的...我無聊之下還是決定試著問問gemini完成我心中的遺憾。
居然真的有解決方法,gemini給我的方案居然是把「OCR文字辨識交給gemini來處理」,天啊!我又再次感受到科技的進步了。
原本的流程應該是
鏡頭拍照片→想辦法取得OCR文字辨識功能→想辦法排除雜訊只留收縮壓與舒張壓數字→轉換為文字,讓程式計算MAP
現在的是
鏡頭拍照片→叫gemini找圖片中收縮壓與舒張壓數字→轉換為文字,讓程式計算MAP
但是google協作平台不允許程式調用手機的鏡頭,所以這東西薯條目前也沒給薯條父用,可能留著自high或慢慢改進。
Vibe coding太有趣了,希望之後有靈感還能多做一些讓生活更方便的小工具😋
















