Apache Superset簡介與安裝

更新於 發佈於 閱讀時間約 3 分鐘

raw-image

今天如果要幫公司進行數據分析儀表板的開發,大部分企業會選擇微軟的解決方案例如Power BI,但是訂閱費用往往會讓提出企劃又打不到預期效果的人丟了工作

raw-image

這時Apache Superset或許可以解決這個問題

Apache Superset是一款開源的數據可視化和商業智能平台,具有強大的數據分析和視覺化功能。Superset的目標是提供一個易於使用且具有交互式介面的數據分析平台,使得數據分析師和數據科學家能夠快速分析和可視化數據。

Superset與許多企業一起使用,以解決數據分析問題。例如, Airbnb使用Superset來支持其全球數據分析團隊,幫助他們進行數據分析和視覺化。

Superset的優點包括:

易於使用:Superset提供了一個直觀的介面,使得數據分析師和數據科學家能夠快速分析和可視化數據。

Dashboard

Chart

Dataset

SQLLab

主要分成這四大類來讓使用者了解如何製作圖表以及製作流程

功能強大:Superset支持許多數據分析和視覺化功能,包括圖表,地圖,漏斗圖等。

raw-image

圖表來源主要來自Apache Echart ,預設圖表已經可以應付大部分的數據工作,當然如果要擴充也是可以,只是需要軟體開發的技能

raw-image

整合性:Superset可以與多種數據存儲和分析工具整合,包括PostgreSQL,MySQL,Amazon Redshift等。

開源:Superset是開源軟件,因此免費且可以自由使用和修改。

然而,Superset也有一些缺點:

效能:對於大型數據集,Superset的效能可能不夠強大。

  1. 技術支持:Superset是一個開源項目,因此技術支持可能不如商業軟件。
  2. 功能有限:相比其他商業智能平台,Superset的功能可能有限。

Apache Superset是一個很好的數據可視化和商業智能平台,特別適合小型和中型企業。由於其易於使用和功能強大的特點,Superset已成為許多企業數據分析和視覺化的首選工具。

安裝步驟

1. 克隆 Superset 的 GitHub 儲存庫

在終端機中執行以下命令來克隆 Superset 的代碼庫:

git clone https://github.com/apache/superset.git

當這個命令成功完成後,應該在當前目錄下看到一個新的 superset 資料夾。

2. 透過 Docker Compose 啟動 Superset

切換到在第一步中創建的 superset 資料夾:

cd superset

開發模式

如果正在 master 分支上工作,並希望以開發模式運行,請執行以下命令:

docker compose up

提示: 在開發模式下,superset-node 容器需要完成構建資源,以便 UI 能夠正確渲染。如果您只是想嘗試 Superset 而不進行任何代碼更改,請遵循下面記錄的生產模式或特定版本的步驟。

生產模式

如果正在 master 分支上工作,並希望以生產模式運行,請執行以下命令:

docker compose -f docker-compose-non-dev.yml pull
docker compose -f docker-compose-non-dev.yml up

3. 訪問 Superset

在 Docker Compose 啟動 Superset 之後,可以通過瀏覽器訪問 Superset 的 Web 介面。通常,這會在 http://localhost:8088 上可用,除非進行了其他配置。

參考連結

https://superset.apache.org/docs/installation/installing-superset-using-docker-compose/

作者:黃翊鈜 Roy Hwang

經歷:ML engineer , AI engineer

留言
avatar-img
留言分享你的想法!
avatar-img
Roy Hwang的沙龍
1會員
10內容數