利用Google Gemini AI自動化產品圖片優化流程

更新於 發佈於 閱讀時間約 4 分鐘
raw-image

## 1. 自動化的目標


這個自動化流程旨在利用Google Gemini AI模型來優化和生成新的產品圖片。具體來說,當用戶上傳產品圖片到指定的Google Drive資料夾時,系統會自動分析圖片內容,並根據分析結果為產品設計一個專業、具有高轉化率的背景,最終生成一張全新的優化產品圖片,並將其保存到另一個指定資料夾中。


## 2. 使用的工具

1. **Google Drive** - 用於監控資料夾、獲取圖片文件、上傳最終生成的圖片

2. **Gemini AI** - 用於上傳圖片分析、圖片內容描述、生成專業產品背景提示詞以及最終圖像生成

3. **HTTP** - 用於呼叫Gemini圖像生成API

4. **Utility tools** - 包括等待模組和計數器模組


## 3. 流程設置指南

### 步驟 1: 監控Google Drive資料夾

- 設定模組:Google Drive > Watch Files in a Folder

- 設定監控「圖片生成」資料夾中的新檔案

- 設定監視檔案動作為「By Created Time」(監控新建檔案)

- 設定對所有檔案類型進行監控


### 步驟 2: 獲取上傳的圖片文件

- 設定模組:Google Drive > Get a File

- 從上一步獲取的檔案ID抓取完整檔案

- 設定適當的檔案格式轉換選項:文檔為Word、表格為Excel、演示文稿為PowerPoint、繪圖為JPEG


### 步驟 3: 將圖片上傳到Gemini AI

- 設定模組:Gemini AI > Upload a File

- 傳遞來自步驟2的文件數據和檔名

- 這步驟使圖片可被Gemini AI存取與分析


### 步驟 4: 用Gemini AI描述圖片

- 設定模組:Gemini AI > Create a Completion (Gemini Pro)

- 選擇AI模型:gemini-2.0-flash-exp

- 指示AI用英文描述上傳的圖片,不超過20字,並且不使用引號

- 使用在步驟3中上傳的圖片作為輸入


### 步驟 5: 讓Gemini生成背景提示詞

- 設定模組:Gemini AI > Create a Completion (Gemini Pro)

- 設定AI以電子商務專員角色,為步驟4中描述的產品設計合適的背景

- 提示詞包含為產品配置專業且能提高轉化率的背景建議


### 步驟 6: 等待處理

- 設定模組:Function Sleep

- 設定等待時間為10秒,讓前面的處理完成


### 步驟 7: 呼叫Gemini圖像生成API

- 設定模組:HTTP > Send Data

- 目標URL為Gemini圖像生成API端點

- 使用POST方法發送JSON格式資料

- 包含原始圖片、圖片描述和背景提示詞

- 配置生成參數:temperature=1, topK=40, topP=0.95

- 要求回應包含圖片和文本


### 步驟 8: 計數生成的圖片

- 設定模組:Function Increment

- 每次執行時增加一個計數器值

- 設定計數器在方案間保留(reset="scenario")


### 步驟 9: 將生成的圖片保存回Google Drive

- 設定模組:Google Drive > Upload a File

- 從步驟7的HTTP回應中提取圖片數據(Base64編碼)

- 命名格式為當前日期加計數器值:如「26032025_2.jpg」

- 保存到「圖片生成/已生成」資料夾中


結果



## 4. 重要注意事項

1. **API金鑰安全**:這個藍圖中包含了Google API金鑰,在實際部署時應該保護好這個敏感信息,最好使用變數或密鑰管理系統。

2. **錯誤處理**:HTTP請求模組配置了錯誤處理,若圖像生成失敗,流程會忽略錯誤並繼續執行。

3. **資料夾結構**:需要確保Google Drive中有正確的資料夾結構:

   - 「圖片生成」資料夾用於上傳原始圖片

   - 「圖片生成/已生成」資料夾用於存儲生成的圖片

4. **計數器機制**:使用計數器確保生成的圖片有唯一的名稱,避免覆蓋先前生成的圖片。

5. **檔案類型兼容性**:此流程主要針對圖片檔案設計,其他類型檔案可能無法正確處理。

6. **AI生成控制**:藍圖中使用了特定的AI參數(temperature, topK, topP),這會影響生成圖片的創意性和一致性。

7. **執行延遲**:包含10秒等待時間,確保各步驟間有足夠處理時間,這在高負載情況下可能需要調整。

8. **圖片尺寸與質量**:Gemini生成的圖片會有固定的尺寸和格式,如需特定尺寸可能需要額外處理。


留言
avatar-img
留言分享你的想法!
avatar-img
馬可🐴 | #創業 #工作自動化
11會員
20內容數
介紹用AI及自動化工具,簡化工作流程
2025/04/15
本自動化流程整合Gemini AI、Google Slides及Instagram Business,完成語錄內容生成、簡報設計及IG發佈流程,實現內容產出全自動化,大幅提高效率,每週可節省10小時以上的人工作業時間。
Thumbnail
2025/04/15
本自動化流程整合Gemini AI、Google Slides及Instagram Business,完成語錄內容生成、簡報設計及IG發佈流程,實現內容產出全自動化,大幅提高效率,每週可節省10小時以上的人工作業時間。
Thumbnail
2025/04/13
使用 Make 自動化工具來簡化活動報名和 Check-in 流程。通過 Make,你可以自動生成QR Code,並將其與活動報名資料整合,實現無需手動操作的報名和簽到過程。影片還展示了如何使用 API 申請 QR Code,並將其更新到 Google Sheet 中,從而實現實時的簽到記錄和通知。
2025/04/13
使用 Make 自動化工具來簡化活動報名和 Check-in 流程。通過 Make,你可以自動生成QR Code,並將其與活動報名資料整合,實現無需手動操作的報名和簽到過程。影片還展示了如何使用 API 申請 QR Code,並將其更新到 Google Sheet 中,從而實現實時的簽到記錄和通知。
2025/04/07
這套自動化流程能大幅提升專案管理效率,自動化藍圖的整理、儲存、分析與追蹤,節省大量時間並降低錯誤率。透過整合Make、Google和OpenRouter AI工具,自動產生JSON與Google文件格式的藍圖,並利用AI生成易於理解的分析報告,讓團隊輕鬆管理與維護Make中的每個情境。
Thumbnail
2025/04/07
這套自動化流程能大幅提升專案管理效率,自動化藍圖的整理、儲存、分析與追蹤,節省大量時間並降低錯誤率。透過整合Make、Google和OpenRouter AI工具,自動產生JSON與Google文件格式的藍圖,並利用AI生成易於理解的分析報告,讓團隊輕鬆管理與維護Make中的每個情境。
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
運用生成的AI圖像來激發視覺和創意,無論是生成素材、用在社交媒體上,這些圖像都能為你的的視覺帶來獨特的風格。
Thumbnail
運用生成的AI圖像來激發視覺和創意,無論是生成素材、用在社交媒體上,這些圖像都能為你的的視覺帶來獨特的風格。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
Freepik除了提供素材下載外,還可以線上生成AI圖片, 圖片生成工具名為「AI Image Generator」,只需要輸入文字就能快速生成圖片,每天能免費生成 20 張圖片,還可依照自己的喜好設定不同風格、燈光、畫面尺寸等參數。
Thumbnail
Freepik除了提供素材下載外,還可以線上生成AI圖片, 圖片生成工具名為「AI Image Generator」,只需要輸入文字就能快速生成圖片,每天能免費生成 20 張圖片,還可依照自己的喜好設定不同風格、燈光、畫面尺寸等參數。
Thumbnail
這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流,還可以幫線稿上色。
Thumbnail
這篇要搭建一個同時生成寫實照片跟動漫風格圖片的工作流,還可以幫線稿上色。
Thumbnail
今日分享Gemini它是Bard 進階變升版,能力更強大了,不過我還是喜歡它的圖片辦示AI能力,尤其是在上課時常常會拍照老師上課的投影片或是看書覺得重要點會照片做筆記,之前需要回去之後再整理,但也是要花時間就偷懶,但是這次功能我一直很喜歡,讓我來示範。這次以【打造第二大腦】中有重點PARA運用,拍
Thumbnail
今日分享Gemini它是Bard 進階變升版,能力更強大了,不過我還是喜歡它的圖片辦示AI能力,尤其是在上課時常常會拍照老師上課的投影片或是看書覺得重要點會照片做筆記,之前需要回去之後再整理,但也是要花時間就偷懶,但是這次功能我一直很喜歡,讓我來示範。這次以【打造第二大腦】中有重點PARA運用,拍
Thumbnail
亞馬遜推出 AI 生成圖像工具 / reddit 更新品牌視覺 / 微軟小畫家加入 AI 圖像生成功能 / 中國第一起 AI 著作權判決案例 / Adobe 發布 DMV3D
Thumbnail
亞馬遜推出 AI 生成圖像工具 / reddit 更新品牌視覺 / 微軟小畫家加入 AI 圖像生成功能 / 中國第一起 AI 著作權判決案例 / Adobe 發布 DMV3D
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News