著手開發我的第一個AI Side Project--每拍呷

更新於 發佈於 閱讀時間約 6 分鐘

在初步學習了Python、Gradio、Azure、SQL&NoSQL、LINE BOT之後,終於要開始做我的第一個AI Side Project--每拍呷-營養標示一拍就懂!

目標:兩周內完成(瑟瑟發抖)

初衷

以下資訊是否常常看得您眼花撩亂、或是乾脆不看呢?(示意範例,非真實食品)

黃線左邊的是成份表,右邊的是營養標示,其實對有些長輩來說,並不是很好閱讀。

黃線左邊的是成份表,右邊的是營養標示,其實對有些長輩來說,並不是很好閱讀。

  • 營養標示字又多又小、老花眼看不清楚...
  • 苯甲酸(安息香酸)?二丁基羥基甲苯(BHT)?是什麼用途呢?看得霧煞煞...
  • 很想了解,但是各家食品廠做的營養標示,每一份的克數都不盡相同,不知道怎麼換算...
raw-image

我想做的「每拍呷」是幫助長輩看懂營養成份標示的LINE BOT,許多長輩因營養標示字體太小、內容複雜難懂,因此放棄查看營養標示。「每拍呷」旨在透過簡單、直觀的方式,讓長輩只要一個動作:拍照上傳LINE,就能看懂營養成份標示,吃的更安心、也更能有趣地掌握自己的飲食健康,每次拍照都好呷!

使用情境

  • 購物時:長輩在超市採買時,想瞭解某項加工食品的營養成份,隨手一拍,立即獲得 AI 分析與建議。
  • 日常健康管理:長輩想追蹤自己每天的飲食狀況,透過 LINE BOT 的「每日小挑戰」和「累積追蹤」功能,讓吃零食也能無負擔。
  • 家庭關懷互動:子女或孫輩可以鼓勵家中長輩使用「每拍呷」,共同參與健康的飲食管理,增加家庭成員間的健康話題。

需要用到的技術

  • 智慧光學辨識 (OCR):
    辨識食品包裝上的營養成分標示與成分內容,克服字體小、排版複雜等挑戰。(若拍照失敗,也支援文字訊息輸入)
  • 生成式AI:
    1. 利用生成式AI將辨識出的營養數據,轉化為長輩容易理解的白話文建議和生動比喻。例如:「吃完一包等於喝了三杯全糖珍奶、五碗白飯的熱量」,並給出建議(例如:下一餐要減少攝取含鈉量高的食物、多喝水)。
    2. 在用戶加入LINE時就詢問慢性病狀況(三高、腎臟病),結合用戶設定的健康檔案,在AI分析資訊後提供個人化的飲食警示與替代方案,讓建議更具針對性。(例如:含糖量太高了,建議少吃或分多天食用。)
    3. 綜合評估系統:建立多項營養指標的權重模型,讓AI將成份表比較難懂的內容,歸類為「香料」、「防腐」、「甜味劑」、「乳化劑」等等成份的綜合判斷,並做成圓餅圖回傳給用戶。
    4. AI給予直觀的紅🔴、黃🟡、綠🟢綜合評分。
  • (Bonus)語音播放功能(TTS):
    預計使用Azure的TTS服務,提供分析結果的語音朗讀功能,方便視力不佳的長輩「聽懂」食物資訊。如果有台語服務就更讚了。待我行有餘力再來想辦法研究這一塊...
  • (Bonus)db:若要記錄用戶的上傳內容並進行互動(例如:蒐集到十樣綠燈食品就會頒發數位獎狀),就需要做資料庫了,待我行有餘力再來想辦法研究這一塊...

MVP運作流程

拍照上傳

用戶用手機拍攝營養標示與成分表。

⬇️OCR 辨識與數據提取

LINE BOT接收照片,透過Azure OCR服務辨識文字,並提取熱量、脂肪、糖、鈉、份量等關鍵數據。

⬇️生成建議與評估

AI根據辨識出的數據,結合用戶預設的健康標準,生成易懂的營養分析、紅黃綠燈評分和個人化建議。

⬇️文字轉語音(選配功能)

若用戶啟用語音播放功能,分析結果文字將轉換為語音,播放給長輩聽。

⬇️回傳 LINE 聊天室

將分析結果(文字、表情符號、或圖像)透過多個對話泡泡回傳至LINE聊天室。

raw-image

預計工作進度(每日3~4小時)

由於我是第一次做Side Project,進度內容是跟Gemini一起討論的,實際進度就做滾動式修正吧!且戰且走XD

第一週:基礎建構與數據核心 (D1 - D7)

D1:研究國人營養素參考攝取量(DRIs)的最新標準,確立營養標準依據與數據轉換邏輯。

D2:細化所有營養素的判斷條件,並建立生成建議的範本。整理個人化建議的觸發條件(例如:若用戶有高血壓標籤,則鈉含量只要超過 X 值就給予警示)。

D3:完成 OCR 服務的基礎設定與初步測試。撰寫一個Python程式碼,使用一張營養標示圖片進行OCR服務呼叫。

D4:能從 OCR 原始結果中精準提取所需的營養數據。找出營養標示和成分表中的關鍵文字(如:熱量、脂肪、糖、鈉、每一份量、本包裝含幾份)精確提取這些數值。

D5:建立 LINE BOT 雛形,能接收用戶訊息。

D6:LINE BOT 圖片接收與處理。

D7:前後端整合,確保資料流從 LINE 收到圖片 -> OCR 辨識 -> 數據提取 -> 數值計算 -> 回覆 LINE 的整個流程暢通。

-----

第二週:智慧解析與用戶體驗優化 (D8 - D14)

D8:紅黃綠燈判斷與基礎生成建議,初步生成白話文建議。

D9:讓 AI 生成的建議更生動有趣、貼近長輩語氣。考慮如何在建議中加入一些關懷語句或鼓勵。

D10:個人化建議與 LINE 回覆介面優化,將分析結果拆解為多個對話泡泡。使用放大字體、粗體字。

D11:錯誤處理與全面性測試。

D12:進行 MVP 的端到端測試,並收集初步用戶回饋。邀請至少 2-3 位測試者。

D13:根據回饋調整與功能強化。

D14:專案總結與部署準備(如果時間允許且有部署需求)。

Gemini的建議:

考量到 14 天的緊湊時程,我建議在 MVP 階段暫時不加入「文字轉語音」功能。現階段應將重心放在核心的 OCR 辨識、AI 精準分析和高可讀性的文字回覆上。一旦 MVP 穩定且用戶體驗良好,文字轉語音可以作為第二階段的優化目標或加分項目。實現語音播放需要額外的 TTS API 串接與音檔處理,可能會顯著增加開發時間。

希望我跟AI協作順利、每拍呷順利產出🫡加油!

留言
avatar-img
留言分享你的想法!
avatar-img
Galing的腦內劇場
0會員
15內容數
學習AI的新手,在這邊分享學習筆記跟知識,希望文組轉戰AI也可以闖出一片天💪 大學學的是戲劇,擁有服務業12年經驗,擔任銷售顧問;2025.07開始學習python與AI商業應用,目標是讓職涯變得更自由有彈性,做出好玩有趣的東西! 💬喜歡打電動、看動畫、K-pop佛系追星,偶爾可能會出現這些主題的文章。
Galing的腦內劇場的其他內容
2025/08/16
首先讚嘆Azure的資源超級豐富💯 不過初學Azure時,複雜的介面+文件常常讓我感到滿頭問號; 一堆資源、服務又很多種,像是目前學了Cognitive Service、Translator、Speech、Vision、tts、Whisper…所以,寫程式時要記得抓對金鑰跟端點,還有記得檢查定價層
Thumbnail
2025/08/16
首先讚嘆Azure的資源超級豐富💯 不過初學Azure時,複雜的介面+文件常常讓我感到滿頭問號; 一堆資源、服務又很多種,像是目前學了Cognitive Service、Translator、Speech、Vision、tts、Whisper…所以,寫程式時要記得抓對金鑰跟端點,還有記得檢查定價層
Thumbnail
2025/08/15
還記得我第一次聽到「泡泡排序」這四個字時,腦海裡浮現的是肥皂泡泡跟珍珠奶茶的畫面。 結果打開講義一看 — — 什麼珍珠?沒有!也沒有肥皂泡泡!只有一堆數字在那邊跑來跑去,比較、交換、排列,最後由小排到大。 「這…到底跟泡泡有什麼關係?」
Thumbnail
2025/08/15
還記得我第一次聽到「泡泡排序」這四個字時,腦海裡浮現的是肥皂泡泡跟珍珠奶茶的畫面。 結果打開講義一看 — — 什麼珍珠?沒有!也沒有肥皂泡泡!只有一堆數字在那邊跑來跑去,比較、交換、排列,最後由小排到大。 「這…到底跟泡泡有什麼關係?」
Thumbnail
2025/08/12
在資訊爆炸的時代,我們每天都在產生和接收大量的資訊,無論是工作筆記、課堂內容、研究資料、甚至是生活規劃。如果這些內容只是堆在筆記本裡,很快就會變成「找不到、用不起來」的知識黑洞。 這時候,Notebook LM 就像是為筆記而生的智慧助手,幫你把筆記轉化為活的知識庫。
Thumbnail
2025/08/12
在資訊爆炸的時代,我們每天都在產生和接收大量的資訊,無論是工作筆記、課堂內容、研究資料、甚至是生活規劃。如果這些內容只是堆在筆記本裡,很快就會變成「找不到、用不起來」的知識黑洞。 這時候,Notebook LM 就像是為筆記而生的智慧助手,幫你把筆記轉化為活的知識庫。
Thumbnail
看更多
你可能也想看
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
只是想要說出來,從工作開始聊到生活,突然切換到宗教,一切都源起於夢
Thumbnail
只是想要說出來,從工作開始聊到生活,突然切換到宗教,一切都源起於夢
Thumbnail
一切都從思考作品集要怎麼準備開始,所謂的 one 是起頭難(?),在動手寫 code 之前,總覺得自己做不到,一直在自己煩惱,直到前輩們說:開始做看看吧,一頁式網站也好,不開始做永遠不知道自己哪些知識需要補強。 於是決定先幫我的繆思女神做一個網站,讓她可以介紹自己的工作,再放社群連結
Thumbnail
一切都從思考作品集要怎麼準備開始,所謂的 one 是起頭難(?),在動手寫 code 之前,總覺得自己做不到,一直在自己煩惱,直到前輩們說:開始做看看吧,一頁式網站也好,不開始做永遠不知道自己哪些知識需要補強。 於是決定先幫我的繆思女神做一個網站,讓她可以介紹自己的工作,再放社群連結
Thumbnail
在兩寶出生後曾自創 Podcast,但因時間和動力問題終敗。如今四年後,希望透過部落格分享生活、育兒、電商產品等內容,並期望能與有相似想法的人一同成長。
Thumbnail
在兩寶出生後曾自創 Podcast,但因時間和動力問題終敗。如今四年後,希望透過部落格分享生活、育兒、電商產品等內容,並期望能與有相似想法的人一同成長。
Thumbnail
上週六與Podcast課程同組組員共同錄製了人生第一齣廣播劇,從一開始的撰寫劇本就開始燒腦,從無到有的部分實在太困難了,還好在老師建議下藉助了科技的力量—GhatGPT的輔助,果然汲取了不少的靈感,實在不得不讚嘆科技的進步呀!
Thumbnail
上週六與Podcast課程同組組員共同錄製了人生第一齣廣播劇,從一開始的撰寫劇本就開始燒腦,從無到有的部分實在太困難了,還好在老師建議下藉助了科技的力量—GhatGPT的輔助,果然汲取了不少的靈感,實在不得不讚嘆科技的進步呀!
Thumbnail
Yup、開始創作。 就創作吧! 除了創作,還是只能創作。 搜尋了關鍵字, 閱讀了文章, 問了chatgpt, 問了那神秘的內心, 沒有半點收穫。 不想成為抱怨的人, 不想對自己貼標籤, 只能點擊開始創作, 打擊自己, 擊中自己, 揪出真實的自己。 有好的事,也有壞
Thumbnail
Yup、開始創作。 就創作吧! 除了創作,還是只能創作。 搜尋了關鍵字, 閱讀了文章, 問了chatgpt, 問了那神秘的內心, 沒有半點收穫。 不想成為抱怨的人, 不想對自己貼標籤, 只能點擊開始創作, 打擊自己, 擊中自己, 揪出真實的自己。 有好的事,也有壞
Thumbnail
這個專欄分享了除了PV影片之外,自己學習或創作的其他經歷,包括自製頭像的設計和繪製過程。作者分享了創作的初版草稿、上色過程以及根據意見修改的過程。
Thumbnail
這個專欄分享了除了PV影片之外,自己學習或創作的其他經歷,包括自製頭像的設計和繪製過程。作者分享了創作的初版草稿、上色過程以及根據意見修改的過程。
Thumbnail
恩...該寫些什麼呢?
Thumbnail
恩...該寫些什麼呢?
Thumbnail
我心想「天啊,我一個連火柴人的不會畫的傢伙,居然可以用幾行字就弄出這種程度的圖!」 我的AI繪圖學習之旅,今天剛好滿一年,想來貼幾張圖回顧一下自己學習的進步幅度。
Thumbnail
我心想「天啊,我一個連火柴人的不會畫的傢伙,居然可以用幾行字就弄出這種程度的圖!」 我的AI繪圖學習之旅,今天剛好滿一年,想來貼幾張圖回顧一下自己學習的進步幅度。
Thumbnail
最近加入了這個有趣的地方 ,收到了系統關切 ,怎麼還沒看到你的創作 文字,是人們用來溝通交流的工具。 常常會很佩服能把文字依照自己想法,打成一大串文章的創作者。 總是想像,能一直不斷的創作文章,以此維生的人,到底是如何文思泉湧的。 也許真的需要不斷的大量閱讀,才能有更多的文字素材可以隨時讓大
Thumbnail
最近加入了這個有趣的地方 ,收到了系統關切 ,怎麼還沒看到你的創作 文字,是人們用來溝通交流的工具。 常常會很佩服能把文字依照自己想法,打成一大串文章的創作者。 總是想像,能一直不斷的創作文章,以此維生的人,到底是如何文思泉湧的。 也許真的需要不斷的大量閱讀,才能有更多的文字素材可以隨時讓大
Thumbnail
AI時代,不會畫圖也能做貼圖 2023ChatGPT橫空出世(幾乎八成的報導都用這句) 我終於不僅可以我手寫我腦 腦中的畫面,終於也有機會讓別人看看惹(誰要看😅 2023的最後一天,我上架了自己做的line貼圖了~~
Thumbnail
AI時代,不會畫圖也能做貼圖 2023ChatGPT橫空出世(幾乎八成的報導都用這句) 我終於不僅可以我手寫我腦 腦中的畫面,終於也有機會讓別人看看惹(誰要看😅 2023的最後一天,我上架了自己做的line貼圖了~~
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News