柴郡貓姍蒂

筆記[工作]-BigQuery文件閱讀：查詢計畫與時程

當BigQuery執行查詢工作時，會將宣告式SQL陳述式轉換成執行圖，圖中會把執行作業拆分成一系列的查詢階段，而這些階段是由更精細的執行步驟組合所組成的。BigQuery會使用大量分散式平行架構來執行這些查詢。階段會模擬許多潛在工作站可能並行執行的工作單元。各階段會透過快速的分散式重組架構通訊。

#GCP #BigQuery #查詢計畫與時程

筆記[工作]-GCP相關知識查詢：_Default Bucket

_Default Bucket 是GCP自動為每個Google Cloud Project建立的預設日誌儲存桶，大部分的日誌(像是稽核記錄、GKE logs、Compute Engine logs等)預設都會儲存在這裡。每個_Default bucket預設會包含以下view： _AllLo

#GCP #DefaultBucket #Logging

VPC Serverless Connectors 是Google Cloud提供的一種機制，允許「Serverless工作負載(如Cloud Run、Cloud Functions、App Engine標準環境)」安全且私密地連線到使用者的VPC資源(例如 VM、Cloud SQL、Redis、

#GCP #AuditLogs #Logging

SSO SSO全名為Single Sign On，意思是多個登入端點，皆採用相同的認證管道。就是當企業有多個網站時，可以從一個統一的入口登入帳戶，接著就所有的網站都能使用。常見的例如Google這樣的多服務平台，無論要登入Gmail、雲端硬碟還是Youtube，都會導向到同一個 Google 登入

#SSO #PSC #GCP

#SoleTenantNode #SpotVM #PreemptibleVM

在研讀Google Cloud Compute Engine時，讀到一些名詞，不是很懂，問了ChatGPT和查詢網路文章後，將回答紀錄如下： Sole-Tenant Node Sole-Tenant Node(專用主機節點)是Google Cloud Platform(GCP)的一種虛擬機部

筆記[工作]-BigQuery文件閱讀：最佳化調整查詢運算

(一樣是接續前一篇文章) 減少要處理的資料建議不要使用SELECT * 僅查詢所需欄位，控管投影。投影指的是查詢作業讀取的欄位數。投影多餘的資料欄會產生額外的(浪費)I/O和具體化(寫入結果)。避免使用依日期進行資料分割的資料表請勿使用依日期進行資料分割的資料表(又稱為以日期命名的資

#GCP #BigQuery #最佳化調整查詢運算

筆記[工作]-BigQuery文件閱讀：取得查詢效能洞察資料

運算單元爭用情況執行查詢時，BigQuery會嘗試將查詢所需的工作拆分為"工作"。工作是指單一資料切片，可輸入至"階段"並從中輸出。單一時段會接收工作，並執行該階段的資料切片。理想情況下，BigQuery分區會並行執行這些工作，以便達到高效能。如果查詢有許多工作準備開始執行，但BigQuery無

#BigQuery #取得查詢成效洞察資料 #GCP

BigQuery的Region和Multi-Region的比較：地理範圍： Region：單一資料中心區域 Multi-Region：多個資料中心區域的集合可用性： Region：較低(依賴單一區域) Multi-Region：較高(跨多個區域) 容錯能力： Region：一般

#GCP #BigQuery #Region

筆記[工作]-GCP功能操作：Shared VPC、VPC Peering

因為名詞解釋在ChatGPT上都查得到，所以此篇筆記只記錄如何操作的影片連結(：P) 大概簡單比較兩者使用的情境： Shared VPC：同一個VPC網路跨專案共用，中央管理、安全一致 VPC Peering：兩個獨立VPC點對點互通，各自管理下面是如何在GCP操作兩者的影片： Shar

#sharedvpc #vpcpeering #GCP