開源數據視覺化Web 應用程式Superset串連可擴展分佈式分析引擎BigQuery:啟動指南

閱讀時間約 6 分鐘
raw-image

應用場景:

客戶有數據分析的需求,本身對tableau有使用經驗也比較熟悉,但是當下公司是沒有訂閱tableau服務來進行數據分析,日後如果要轉移伺服器也比較麻煩,tableau的訂閱是以公司為單位,如果使用Superset,一來superset是開源專案,無費用的產生,二來轉移系統也是比較方便。

之所以會選擇Bigquery做為查詢引擎,主要還是日後遷移至雲端的預備方便,無伺服器的資料倉儲系統,高擴充性與成本的考量,免費方案有 10 GB 的儲存空間以及每月 1 TB 的查詢量。

Superset 簡介

Apache Superset是一個數據瀏覽和可視化Web 應用程序。Superset特性: 支持幾乎所有主流的數據庫,包括MySQL、PostgresSQL、Oracle、SQL Server、SQLite、SparkSQL 等,並深度支持Druid。豐富的可視化展示,支持自定義創建dashboard。

Druid:

是用Java編寫的面向列的開放源代碼分佈式數據存儲。Druid旨在快速獲取大量事件數據,並在數據之上提供低延遲查詢。

Druid這個名字來自許多角色扮演遊戲中變形的Druid類,以反映系統的體系結構可以改變以解決不同類型的數據問題。

Druid通常用於BI OLAP應用程序,以分析大量的實時和歷史數據。

BigQuery 簡介

BigQuery 是一個完全託管的企業數據倉庫,可通過機器學習、地理空間分析和商業智能等內置功能幫助您管理和分析數據。BigQuery 的無服務器架構讓您可以使用 SQL 查詢以零基礎架構管理來回答您組織的最大問題。BigQuery 可擴展的分佈式分析引擎讓您可以在幾秒鐘內查詢 TB 字節,在幾分鐘內查詢 PB 字節。

  • 安裝 Docker Engine 和 Docker Compose
  • 下載 github 的 Superset
  • 使用Docker compose 安裝
  • 登錄Superset
  • 安裝BigQuery 驅動
  • 連接到BigQuery

1. 安裝 Docker Engine 和 Docker Compose

Mac OSX

安裝 Docker for Mac,其中包括 Docker 引擎和docker-compose開箱即用的最新版本。

安裝 Docker for Mac 後,打開 Docker 的首選項面板,轉到“資源”部分並將分配的內存增加到 6GB。默認情況下僅分配 2GB 的 RAM,Superset 將無法啟動。

2. 下載 github 的 Superset

$ git clone https://github.com/apache/superset.git

該命令成功完成後,您應該superset會在當前目錄中看到一個新文件夾。

3. 使用Docker compose 安裝

導航到您在步驟 1 中創建的文件夾:

$ cd superset

運行以下命令:

$ docker-compose -f docker-compose-non-dev.yml pull
$ docker-compose -f docker-compose-non-dev.yml up

4. 登錄Superset

您的本地 Superset 實例還包括一個 Postgres 服務器來存儲您的數據,並且已經預加載了一些與 Superset 一起提供的示例數據集。您現在可以通過您的網絡瀏覽器訪問 Superset 訪問http://localhost:8088

raw-image

使用默認用戶名和密碼登錄:

username: admin
password: admin
raw-image

5.安裝 BigQuery 驅動

開啟終端機

創建requirements-local.txt

# From the repo root...
touch ./docker/requirements-local.txt

添加在上面步驟中選擇的驅動程序:

echo "pybigquery" >> ./docker/requirements-local.txt

使用內置的新驅動程序重建本地映像:

docker-compose build --force-rm

Docker 鏡像的重建完成後(這需要幾分鐘),您可以使用以下命令重新啟動:

docker-compose up

6.連接到BigQuery

在 Superset 中添加新的 BigQuery 連接時,您需要添加 GCP 服務帳戶憑據文件(作為 JSON)。

  1. 通過 Google Cloud Platform 控制面板創建您的服務帳戶,為其提供對相應 BigQuery 數據集的訪問權限,並下載服務帳戶的 JSON 配置文件。
  2. 在 Superset 中,您可以上傳該 JSON 或添加以下格式的 JSON blob(這應該是您的憑證 JSON 文件的內容):
# 這是範例
{
"type": "service_account",
"project_id": "...",
"private_key_id": "...",
"private_key": "...",
"client_email": "...",
"client_id": "...",
"auth_uri": "...",
"token_uri": "...",
"auth_provider_x509_cert_url": "...",
"client_x509_cert_url": "..."
}

進入Google Cloud 控制台後

依序點選

IAM與管理->服務帳戶->點選服務帳戶->

金鑰->新增金鑰->建立新的金鑰->Json

即可下載Json file

回到Superset,點選Databese

raw-image

點選 +DATABASE

raw-image

選擇BigQuery

raw-image

上傳Json file

raw-image

接下來您就可以在Superset 操作BigQuery了

raw-image

測試是否可以操作BigQuery的Public Dataset

raw-image
raw-image

參考資料

https://superset.apache.org/docs/databases/bigquery/

作者:黃翊鈜 Roy Hwang

經歷:ML engineer , AI engineer

    0會員
    24內容數
    留言0
    查看全部
    發表第一個留言支持創作者!
    你可能也想看
    [程式語言] DataCamp 使用心得與費用公開 學習Python數據分析 文末附上2024 50% off 折扣連結網路上自學程式語言的網站百百種有Coursera、Udemy、Youtube的免費資源等等。程式小白要怎麼從眾多資源中選擇最適合自己的學習平台,而我又為什麼選擇DataCamp為Python自學平台呢?原因可以分為以下幾點: DataCamp的系統性課程選擇: 有提供兩種有系統且直接能達到你
    avatar
    Hsinyin Chang
    2024-05-26
    英國全球人才簽證申請說明與流程公開|台灣劇場技術人員 FuFu 專訪,把生活活成自己喜歡的樣子FuFu 是一位來自臺灣的台灣劇場技術人員,她在臺灣劇場工作多年,後來獲得英國全球人才簽證,回到倫敦求職。在這篇文章中,她分享了申請全球人才簽證的經驗、申請時程和費用等詳細資訊,並提供了一些建議和技巧。
    Thumbnail
    avatar
    Yuwen C
    2024-03-24
    NVIDIA 公司介紹:開創 GPU 與 AI 新紀元的技術巨頭你是否有玩過電腦遊戲或聽說過 AI 技術的崛起?今天,讓我帶大家深入了解 NVIDIA,一家在這些領域都佔有一席之地的全球科技公司。
    Thumbnail
    avatar
    貓的股倉
    2023-10-05
    NVIDIA 公司介紹:開創 GPU 與 AI 新紀元的技術巨頭你是否有玩過電腦遊戲或聽說過 AI 技術的崛起?今天,讓我帶大家深入了解 NVIDIA,一家在這些領域都佔有一席之地的全球科技公司。
    Thumbnail
    avatar
    貓的股倉
    2023-10-05
    〔劇場狂粉的日常〕EP215 - 【北藝大科技藝術館】開幕節目《迴路花園》🌿「🔗🌹🔗🌻🔗🪻🔗🪴🔗🌵🔗」 來賓介紹👏👏👏 -- 劇場導演:王嘉明 -- 新媒體藝術家:張暉明 兩位導演來開工?灑淨?XD 北藝大科技藝術館.... 在山頂上……北藝大游泳池旁那個啦!🤣
    Thumbnail
    avatar
    鳳君
    2023-09-28
    〔劇場狂粉的日常〕EP215 - 【北藝大科技藝術館】開幕節目《迴路花園》🌿「🔗🌹🔗🌻🔗🪻🔗🪴🔗🌵🔗」 來賓介紹👏👏👏 -- 劇場導演:王嘉明 -- 新媒體藝術家:張暉明 兩位導演來開工?灑淨?XD 北藝大科技藝術館.... 在山頂上……北藝大游泳池旁那個啦!🤣
    Thumbnail
    avatar
    鳳君
    2023-09-28
    【技術嘗試 Try Technique】嘗試 Meta 開源工具 Nougat:把學術文章轉 MultiMarkdown有沒有遇過想打開文獻 PDF 想進行複製卻複製出很奇怪的格式的時候? 比較喜歡 Markdown、LaTex 不喜歡 PDF? 那你或許會喜歡 Meta 新開源的工具:Nougat PS. 這篇不會介紹背後技術,僅嘗試安裝與嘗試的過程 個人對看 Paper 用 PDF 其實又愛又恨。愛在方便不同
    Thumbnail
    avatar
    GQ 的小豬
    2023-09-01
    共享攀樹師視野 臺北典藏植物園開課樹藝交流【記者_許家源/雙北報導】 立秋甫過,天候變化迅速,宛若秋老虎發威。趁著陽光普照,臺北典藏植物園把握盛夏時光,邀請到臺灣第一位攀樹師翁恒斌老師到園區跟志工同仁們分享樹上世界的美麗與辛苦。老師除了介紹樹木的修枝技巧和過往攀樹案例,也實際帶夥伴們觀察園區樹木,分享從攀樹師視角出發的修枝觀察與植物知識,
    Thumbnail
    avatar
    許家源記者
    2023-08-25
    緣絆~桃花開運術~改變了我的人生我是一個很平凡的作業員,大部分的時間公司訂單不怎麼多,就是一間規模不大的公司,說出去也沒什麼人知道,比起台積電、聯發科、鴻海這些大公司,我們公司沒甚麼名氣,在同學之間大家難免會比較每個人的薪水、工作,最常在同學會講到,某某某又升遷了,年終又發了多少,這真的是我最不想討論的問題了,但比起這個,更讓我覺
    Thumbnail
    avatar
    緣。絆
    2023-07-02