筆記[工作]-BigQuery文件閱讀:取得查詢效能洞察資料

更新於 發佈於 閱讀時間約 2 分鐘

以下是工作使用到BigQuery時需要考慮來優化查詢的點(大部分是直接從文章中節錄出來:P)

運算單元爭用情況

執行查詢時,BigQuery會嘗試將查詢所需的工作拆分為"工作"。工作是指單一資料切片,可輸入至"階段"並從中輸出。單一時段會接收工作,並執行該階段的資料切片。理想情況下,BigQuery分區會並行執行這些工作,以便達到高效能。如果查詢有許多工作準備開始執行,但BigQuery無法取得足夠的可用運算單元來執行這些工作,就會發生運算單元爭用情形。

對於未分割的資料表,BigQuery會讀取整個資料表。分區資料表有助於確保只查詢感興趣的資料表子集。

重組配額不足

在執行查詢之前,BigQuery會將查詢邏輯分割為"階段"。BigQuery運算單元會執行各個階段的工作。當運算單元完成階段工作執行作業時,會將中繼結果儲存在shuffle中。查詢中的後續階段會讀取Shuffle中的資料,以便繼續執行查詢。如果需要寫入重組的資料量超過重組容量,就會發生重組配額不足的情況。

減少查詢處理的資料量可能會降低shuffle使用量。SQL中的某些作業通常會更廣泛地使用shuffle,尤其是JOIN作業和GROUP BY子句。盡可能減少這些作業中的資料量,或許可以降低隨機播放的用量。

分區偏差

資料分布不均可能導致查詢執行速度變慢。執行查詢時,BigQuery會將資料分割成小型分區。無法在不同時段之間共用分區。因此,如果資料分布不均,部分分區會變得非常大,導致處理過大分區的運算單元異常終止。


來源文件:取得查詢成效洞察資料


留言
avatar-img
留言分享你的想法!
avatar-img
柴郡貓姍蒂的沙龍
49會員
39內容數
2025/08/10
BigQuery的Region和Multi-Region的比較: 地理範圍: Region:單一資料中心區域 Multi-Region:多個資料中心區域的集合 可用性: Region:較低(依賴單一區域) Multi-Region:較高(跨多個區域) 容錯能力: Region:一般
2025/08/10
BigQuery的Region和Multi-Region的比較: 地理範圍: Region:單一資料中心區域 Multi-Region:多個資料中心區域的集合 可用性: Region:較低(依賴單一區域) Multi-Region:較高(跨多個區域) 容錯能力: Region:一般
2025/08/10
因為名詞解釋在ChatGPT上都查得到,所以此篇筆記只記錄如何操作的影片連結(:P) 大概簡單比較兩者使用的情境: Shared VPC:同一個VPC網路跨專案共用,中央管理、安全一致 VPC Peering:兩個獨立VPC點對點互通,各自管理 下面是如何在GCP操作兩者的影片: Shar
2025/08/10
因為名詞解釋在ChatGPT上都查得到,所以此篇筆記只記錄如何操作的影片連結(:P) 大概簡單比較兩者使用的情境: Shared VPC:同一個VPC網路跨專案共用,中央管理、安全一致 VPC Peering:兩個獨立VPC點對點互通,各自管理 下面是如何在GCP操作兩者的影片: Shar
2025/07/06
在研讀Google Cloud IAM(Identity and Access Management)時,讀到成員除了Google帳戶,還可能有Service Account(和其他),不是很懂,故問了ChatGPT,得到以下回答: Service Account是一種由Google管理的特殊
2025/07/06
在研讀Google Cloud IAM(Identity and Access Management)時,讀到成員除了Google帳戶,還可能有Service Account(和其他),不是很懂,故問了ChatGPT,得到以下回答: Service Account是一種由Google管理的特殊
看更多
你可能也想看
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
商業簡報不僅僅是呈現數據,更需要深入瞭解數據分析及有效的工具運用。本文探討於Excel中使用不同函數來改善數據處理效率,包括IF、IFS、VLOOKUP、XLOOKUP及INDEX與MATCH的結合,幫助商業人士更好地從數據中提取洞見,助力業務增值,學習優化數據分析過程,讓您的商業簡報更具影響力。
Thumbnail
商業簡報不僅僅是呈現數據,更需要深入瞭解數據分析及有效的工具運用。本文探討於Excel中使用不同函數來改善數據處理效率,包括IF、IFS、VLOOKUP、XLOOKUP及INDEX與MATCH的結合,幫助商業人士更好地從數據中提取洞見,助力業務增值,學習優化數據分析過程,讓您的商業簡報更具影響力。
Thumbnail
在資料分析過程中,透過衡量變數之間的線性或非線性關係,能有效探索數據集,篩選出重要特徵,並進行預測建模。本文介紹瞭如何理解數據、使用相關矩陣找出變數關聯性,以及利用互資訊評估變數之間的依賴程度,幫助資料科學家在建模過程中選擇適當的變數,提升模型效果。
Thumbnail
在資料分析過程中,透過衡量變數之間的線性或非線性關係,能有效探索數據集,篩選出重要特徵,並進行預測建模。本文介紹瞭如何理解數據、使用相關矩陣找出變數關聯性,以及利用互資訊評估變數之間的依賴程度,幫助資料科學家在建模過程中選擇適當的變數,提升模型效果。
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
作為一名擁有多年經驗的數據分析師,我深知數據分析的重要性及其對企業決策的影響。然而,數據分析並不是在任何情況下都適用。今天我想跟你聊的事情是:在數據量不足或缺乏流程優化目的時,進行數據分析的局限性。
Thumbnail
作為一名擁有多年經驗的數據分析師,我深知數據分析的重要性及其對企業決策的影響。然而,數據分析並不是在任何情況下都適用。今天我想跟你聊的事情是:在數據量不足或缺乏流程優化目的時,進行數據分析的局限性。
Thumbnail
條件資料行是POWER QUERY裡面一個可以設定指定條件,進而判斷符合條件的資料產生指定的內容,就跟EXCEL中的IF函數很像。 但是POWER QUERY的條件資料行,他是利用對話式的視窗,所以不需要自己動手寫函數,就可以順利達到相同的功能。 今天就用1個資料3個題目來學習這個功能
Thumbnail
條件資料行是POWER QUERY裡面一個可以設定指定條件,進而判斷符合條件的資料產生指定的內容,就跟EXCEL中的IF函數很像。 但是POWER QUERY的條件資料行,他是利用對話式的視窗,所以不需要自己動手寫函數,就可以順利達到相同的功能。 今天就用1個資料3個題目來學習這個功能
Thumbnail
本文介紹了如何使用資料樞紐分析的功能來整理所需的資料,並設定圖表的中文字型,最後提供了繪圖的程式碼範例。
Thumbnail
本文介紹了如何使用資料樞紐分析的功能來整理所需的資料,並設定圖表的中文字型,最後提供了繪圖的程式碼範例。
Thumbnail
在POWER QUERY從0到1 #9 樞紐資料行的功能是將長資料轉換成寬資料,使數據可以快速分析。 而所謂的取消資料行樞紐,就是把寬資料轉換成長資料的一個過程,也就是資料的正規化。 如下圖所示,左邊的圖為二維結構,屬於寬資料,每列可能包含多筆數據(1.2.3月),右邊的圖屬於長資料,每列都
Thumbnail
在POWER QUERY從0到1 #9 樞紐資料行的功能是將長資料轉換成寬資料,使數據可以快速分析。 而所謂的取消資料行樞紐,就是把寬資料轉換成長資料的一個過程,也就是資料的正規化。 如下圖所示,左邊的圖為二維結構,屬於寬資料,每列可能包含多筆數據(1.2.3月),右邊的圖屬於長資料,每列都
Thumbnail
分組依據是POWER QUERY將資料統計分析的一個功能,神似EXCEL函數的SUMIF與COUNTIF,不過他的使用上更加的方便與靈活,不需要寫函數也能將多條件、多結果的統計分析迅速呈現。 如下圖例子,要將左邊資料統計分析為右邊多種種結果,用POWER QUERY只要滑鼠點幾下,數據結果馬上
Thumbnail
分組依據是POWER QUERY將資料統計分析的一個功能,神似EXCEL函數的SUMIF與COUNTIF,不過他的使用上更加的方便與靈活,不需要寫函數也能將多條件、多結果的統計分析迅速呈現。 如下圖例子,要將左邊資料統計分析為右邊多種種結果,用POWER QUERY只要滑鼠點幾下,數據結果馬上
Thumbnail
📌附加與合併差異 POWER QUERY附加的另一個好朋友就是資料合併,來了解一下這兩個功能的差異。 附加 就是把多個資料來源,資料中相同標題的資料往下疊加結合再一起 合併 依據某一欄(PQ稱為資料行)的內容作為關鍵字,將其他資料來源依據相同的關鍵字把資料整合再一起。 有沒有發
Thumbnail
📌附加與合併差異 POWER QUERY附加的另一個好朋友就是資料合併,來了解一下這兩個功能的差異。 附加 就是把多個資料來源,資料中相同標題的資料往下疊加結合再一起 合併 依據某一欄(PQ稱為資料行)的內容作為關鍵字,將其他資料來源依據相同的關鍵字把資料整合再一起。 有沒有發
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News