
## 1. 自動化的目標
## 2. 使用的工具
1. **Google Drive** - 用於監控資料夾、獲取圖片文件、上傳最終生成的圖片
2. **Gemini AI** - 用於上傳圖片分析、圖片內容描述、生成專業產品背景提示詞以及最終圖像生成
3. **HTTP** - 用於呼叫Gemini圖像生成API
4. **Utility tools** - 包括等待模組和計數器模組
## 3. 流程設置指南
### 步驟 1: 監控Google Drive資料夾
- 設定模組:Google Drive > Watch Files in a Folder
- 設定監控「圖片生成」資料夾中的新檔案
- 設定監視檔案動作為「By Created Time」(監控新建檔案)
- 設定對所有檔案類型進行監控
### 步驟 2: 獲取上傳的圖片文件
- 設定模組:Google Drive > Get a File
- 從上一步獲取的檔案ID抓取完整檔案
- 設定適當的檔案格式轉換選項:文檔為Word、表格為Excel、演示文稿為PowerPoint、繪圖為JPEG
### 步驟 3: 將圖片上傳到Gemini AI
- 設定模組:Gemini AI > Upload a File
- 傳遞來自步驟2的文件數據和檔名
- 這步驟使圖片可被Gemini AI存取與分析
### 步驟 4: 用Gemini AI描述圖片
- 設定模組:Gemini AI > Create a Completion (Gemini Pro)
- 選擇AI模型:gemini-2.0-flash-exp
- 指示AI用英文描述上傳的圖片,不超過20字,並且不使用引號
- 使用在步驟3中上傳的圖片作為輸入
### 步驟 5: 讓Gemini生成背景提示詞
- 設定模組:Gemini AI > Create a Completion (Gemini Pro)
- 設定AI以電子商務專員角色,為步驟4中描述的產品設計合適的背景
- 提示詞包含為產品配置專業且能提高轉化率的背景建議
### 步驟 6: 等待處理
- 設定模組:Function Sleep
- 設定等待時間為10秒,讓前面的處理完成
### 步驟 7: 呼叫Gemini圖像生成API
- 設定模組:HTTP > Send Data
- 目標URL為Gemini圖像生成API端點
- 使用POST方法發送JSON格式資料
- 包含原始圖片、圖片描述和背景提示詞
- 配置生成參數:temperature=1, topK=40, topP=0.95
- 要求回應包含圖片和文本
### 步驟 8: 計數生成的圖片
- 設定模組:Function Increment
- 每次執行時增加一個計數器值
- 設定計數器在方案間保留(reset="scenario")
### 步驟 9: 將生成的圖片保存回Google Drive
- 設定模組:Google Drive > Upload a File
- 從步驟7的HTTP回應中提取圖片數據(Base64編碼)
- 命名格式為當前日期加計數器值:如「26032025_2.jpg」
- 保存到「圖片生成/已生成」資料夾中
結果
## 4. 重要注意事項
1. **API金鑰安全**:這個藍圖中包含了Google API金鑰,在實際部署時應該保護好這個敏感信息,最好使用變數或密鑰管理系統。
2. **錯誤處理**:HTTP請求模組配置了錯誤處理,若圖像生成失敗,流程會忽略錯誤並繼續執行。
3. **資料夾結構**:需要確保Google Drive中有正確的資料夾結構:
- 「圖片生成」資料夾用於上傳原始圖片
- 「圖片生成/已生成」資料夾用於存儲生成的圖片
4. **計數器機制**:使用計數器確保生成的圖片有唯一的名稱,避免覆蓋先前生成的圖片。
5. **檔案類型兼容性**:此流程主要針對圖片檔案設計,其他類型檔案可能無法正確處理。
6. **AI生成控制**:藍圖中使用了特定的AI參數(temperature, topK, topP),這會影響生成圖片的創意性和一致性。
7. **執行延遲**:包含10秒等待時間,確保各步驟間有足夠處理時間,這在高負載情況下可能需要調整。
8. **圖片尺寸與質量**:Gemini生成的圖片會有固定的尺寸和格式,如需特定尺寸可能需要額外處理。