利用Google Gemini AI自動化產品圖片優化流程

利用Google Gemini AI自動化產品圖片優化流程

更新於 發佈於 閱讀時間約 6 分鐘
raw-image

## 1. 自動化的目標


這個自動化流程旨在利用Google Gemini AI模型來優化和生成新的產品圖片。具體來說,當用戶上傳產品圖片到指定的Google Drive資料夾時,系統會自動分析圖片內容,並根據分析結果為產品設計一個專業、具有高轉化率的背景,最終生成一張全新的優化產品圖片,並將其保存到另一個指定資料夾中。


## 2. 使用的工具

1. **Google Drive** - 用於監控資料夾、獲取圖片文件、上傳最終生成的圖片

2. **Gemini AI** - 用於上傳圖片分析、圖片內容描述、生成專業產品背景提示詞以及最終圖像生成

3. **HTTP** - 用於呼叫Gemini圖像生成API

4. **Utility tools** - 包括等待模組和計數器模組


## 3. 流程設置指南

### 步驟 1: 監控Google Drive資料夾

- 設定模組:Google Drive > Watch Files in a Folder

- 設定監控「圖片生成」資料夾中的新檔案

- 設定監視檔案動作為「By Created Time」(監控新建檔案)

- 設定對所有檔案類型進行監控


### 步驟 2: 獲取上傳的圖片文件

- 設定模組:Google Drive > Get a File

- 從上一步獲取的檔案ID抓取完整檔案

- 設定適當的檔案格式轉換選項:文檔為Word、表格為Excel、演示文稿為PowerPoint、繪圖為JPEG


### 步驟 3: 將圖片上傳到Gemini AI

- 設定模組:Gemini AI > Upload a File

- 傳遞來自步驟2的文件數據和檔名

- 這步驟使圖片可被Gemini AI存取與分析


### 步驟 4: 用Gemini AI描述圖片

- 設定模組:Gemini AI > Create a Completion (Gemini Pro)

- 選擇AI模型:gemini-2.0-flash-exp

- 指示AI用英文描述上傳的圖片,不超過20字,並且不使用引號

- 使用在步驟3中上傳的圖片作為輸入


### 步驟 5: 讓Gemini生成背景提示詞

- 設定模組:Gemini AI > Create a Completion (Gemini Pro)

- 設定AI以電子商務專員角色,為步驟4中描述的產品設計合適的背景

- 提示詞包含為產品配置專業且能提高轉化率的背景建議


### 步驟 6: 等待處理

- 設定模組:Function Sleep

- 設定等待時間為10秒,讓前面的處理完成


### 步驟 7: 呼叫Gemini圖像生成API

- 設定模組:HTTP > Send Data

- 目標URL為Gemini圖像生成API端點

- 使用POST方法發送JSON格式資料

- 包含原始圖片、圖片描述和背景提示詞

- 配置生成參數:temperature=1, topK=40, topP=0.95

- 要求回應包含圖片和文本


### 步驟 8: 計數生成的圖片

- 設定模組:Function Increment

- 每次執行時增加一個計數器值

- 設定計數器在方案間保留(reset="scenario")


### 步驟 9: 將生成的圖片保存回Google Drive

- 設定模組:Google Drive > Upload a File

- 從步驟7的HTTP回應中提取圖片數據(Base64編碼)

- 命名格式為當前日期加計數器值:如「26032025_2.jpg」

- 保存到「圖片生成/已生成」資料夾中


結果



## 4. 重要注意事項

1. **API金鑰安全**:這個藍圖中包含了Google API金鑰,在實際部署時應該保護好這個敏感信息,最好使用變數或密鑰管理系統。

2. **錯誤處理**:HTTP請求模組配置了錯誤處理,若圖像生成失敗,流程會忽略錯誤並繼續執行。

3. **資料夾結構**:需要確保Google Drive中有正確的資料夾結構:

   - 「圖片生成」資料夾用於上傳原始圖片

   - 「圖片生成/已生成」資料夾用於存儲生成的圖片

4. **計數器機制**:使用計數器確保生成的圖片有唯一的名稱,避免覆蓋先前生成的圖片。

5. **檔案類型兼容性**:此流程主要針對圖片檔案設計,其他類型檔案可能無法正確處理。

6. **AI生成控制**:藍圖中使用了特定的AI參數(temperature, topK, topP),這會影響生成圖片的創意性和一致性。

7. **執行延遲**:包含10秒等待時間,確保各步驟間有足夠處理時間,這在高負載情況下可能需要調整。

8. **圖片尺寸與質量**:Gemini生成的圖片會有固定的尺寸和格式,如需特定尺寸可能需要額外處理。


avatar-img
馬可🐴 | #創業 #工作自動化
11會員
18內容數
介紹用AI及自動化工具,簡化工作流程
留言
avatar-img
留言分享你的想法!
本自動化流程整合Gemini AI、Google Slides及Instagram Business,完成語錄內容生成、簡報設計及IG發佈流程,實現內容產出全自動化,大幅提高效率,每週可節省10小時以上的人工作業時間。
使用 Make 自動化工具來簡化活動報名和 Check-in 流程。通過 Make,你可以自動生成QR Code,並將其與活動報名資料整合,實現無需手動操作的報名和簽到過程。影片還展示了如何使用 API 申請 QR Code,並將其更新到 Google Sheet 中,從而實現實時的簽到記錄和通知。
這套自動化流程能大幅提升專案管理效率,自動化藍圖的整理、儲存、分析與追蹤,節省大量時間並降低錯誤率。透過整合Make、Google和OpenRouter AI工具,自動產生JSON與Google文件格式的藍圖,並利用AI生成易於理解的分析報告,讓團隊輕鬆管理與維護Make中的每個情境。
本自動化流程整合Gemini AI、Google Slides及Instagram Business,完成語錄內容生成、簡報設計及IG發佈流程,實現內容產出全自動化,大幅提高效率,每週可節省10小時以上的人工作業時間。
使用 Make 自動化工具來簡化活動報名和 Check-in 流程。通過 Make,你可以自動生成QR Code,並將其與活動報名資料整合,實現無需手動操作的報名和簽到過程。影片還展示了如何使用 API 申請 QR Code,並將其更新到 Google Sheet 中,從而實現實時的簽到記錄和通知。
這套自動化流程能大幅提升專案管理效率,自動化藍圖的整理、儲存、分析與追蹤,節省大量時間並降低錯誤率。透過整合Make、Google和OpenRouter AI工具,自動產生JSON與Google文件格式的藍圖,並利用AI生成易於理解的分析報告,讓團隊輕鬆管理與維護Make中的每個情境。