Apache Superset簡介與安裝

更新於 發佈於 閱讀時間約 3 分鐘

raw-image

今天如果要幫公司進行數據分析儀表板的開發,大部分企業會選擇微軟的解決方案例如Power BI,但是訂閱費用往往會讓提出企劃又打不到預期效果的人丟了工作

raw-image

這時Apache Superset或許可以解決這個問題

Apache Superset是一款開源的數據可視化和商業智能平台,具有強大的數據分析和視覺化功能。Superset的目標是提供一個易於使用且具有交互式介面的數據分析平台,使得數據分析師和數據科學家能夠快速分析和可視化數據。

Superset與許多企業一起使用,以解決數據分析問題。例如, Airbnb使用Superset來支持其全球數據分析團隊,幫助他們進行數據分析和視覺化。

Superset的優點包括:

易於使用:Superset提供了一個直觀的介面,使得數據分析師和數據科學家能夠快速分析和可視化數據。

Dashboard

Chart

Dataset

SQLLab

主要分成這四大類來讓使用者了解如何製作圖表以及製作流程

功能強大:Superset支持許多數據分析和視覺化功能,包括圖表,地圖,漏斗圖等。

raw-image

圖表來源主要來自Apache Echart ,預設圖表已經可以應付大部分的數據工作,當然如果要擴充也是可以,只是需要軟體開發的技能

raw-image

整合性:Superset可以與多種數據存儲和分析工具整合,包括PostgreSQL,MySQL,Amazon Redshift等。

開源:Superset是開源軟件,因此免費且可以自由使用和修改。

然而,Superset也有一些缺點:

效能:對於大型數據集,Superset的效能可能不夠強大。

  1. 技術支持:Superset是一個開源項目,因此技術支持可能不如商業軟件。
  2. 功能有限:相比其他商業智能平台,Superset的功能可能有限。

Apache Superset是一個很好的數據可視化和商業智能平台,特別適合小型和中型企業。由於其易於使用和功能強大的特點,Superset已成為許多企業數據分析和視覺化的首選工具。

安裝步驟

1. 克隆 Superset 的 GitHub 儲存庫

在終端機中執行以下命令來克隆 Superset 的代碼庫:

git clone https://github.com/apache/superset.git

當這個命令成功完成後,應該在當前目錄下看到一個新的 superset 資料夾。

2. 透過 Docker Compose 啟動 Superset

切換到在第一步中創建的 superset 資料夾:

cd superset

開發模式

如果正在 master 分支上工作,並希望以開發模式運行,請執行以下命令:

docker compose up

提示: 在開發模式下,superset-node 容器需要完成構建資源,以便 UI 能夠正確渲染。如果您只是想嘗試 Superset 而不進行任何代碼更改,請遵循下面記錄的生產模式或特定版本的步驟。

生產模式

如果正在 master 分支上工作,並希望以生產模式運行,請執行以下命令:

docker compose -f docker-compose-non-dev.yml pull
docker compose -f docker-compose-non-dev.yml up

3. 訪問 Superset

在 Docker Compose 啟動 Superset 之後,可以通過瀏覽器訪問 Superset 的 Web 介面。通常,這會在 http://localhost:8088 上可用,除非進行了其他配置。

參考連結

https://superset.apache.org/docs/installation/installing-superset-using-docker-compose/

作者:黃翊鈜 Roy Hwang

經歷:ML engineer , AI engineer

avatar-img
1會員
24內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
你可能也想看
Google News 追蹤
Thumbnail
商業簡報不僅僅是呈現數據,更需要深入瞭解數據分析及有效的工具運用。本文探討於Excel中使用不同函數來改善數據處理效率,包括IF、IFS、VLOOKUP、XLOOKUP及INDEX與MATCH的結合,幫助商業人士更好地從數據中提取洞見,助力業務增值,學習優化數據分析過程,讓您的商業簡報更具影響力。
Thumbnail
Supermicro, Inc.為AI、雲端、儲存和 5G/邊緣領域的全方位 IT 解決方案製造商,宣布推出可搭配NVIDIA Omniverse™平台的全新SuperCluster,擴增其SuperCluster隨插即用AI基礎架構解決方案組合,並能提供企業級的高效生成式AI強化型3D工作流程。
Thumbnail
Power BI 是微軟開發的商業智能工具,專為數據可視化和分析設計。它能整合多種數據來源,並將數據轉化為互動式圖表和報表。支持即時更新的儀表板和自然語言查詢,讓用戶快速獲取洞察。其協作和分享功能方便團隊合作,而移動應用支持隨時隨地訪問數據。可以幫助企業做出數據驅動的決策,提高業務效率和競爭力。
Thumbnail
想製作看起來專業又精美的圖表嗎?面對一堆數據卻不知該如何報告嗎? Graphy絕對能滿足你的需求! Graphy是一個提供圖表製作、數據分析等功能的AI工具,讓使用者能夠快速創建和分享數據視覺化的內容,使報告製作變得更加高效、易於理解,無需複雜的整合或廣泛的學習。
Thumbnail
本文介紹了如何使用資料樞紐分析的功能來整理所需的資料,並設定圖表的中文字型,最後提供了繪圖的程式碼範例。
Thumbnail
Tableau是一款數據視覺化工具,目的在於簡化數據分析和決策過程。通過直觀的可視化介面,讓人們無需編程也能進行數據探索和分析。支持多種數據源,包括Excel、SQL數據庫等,透過拖放操作創建圖表和儀表板,分享洞察見解。幫助使用者和組織更加數據驅動,優化決策和業務流程
Thumbnail
本篇文章介紹了智能投資、科技與金融的結合,以及相關的投資策略與市場趨勢。內容涉及科技產品的市場需求與供應、個人生活與體悟、產業分析與市場觀察、臺股市場表現與個人心態、AI技術發展等各方面。文章中提到了一些公司和產品的名稱,如OpenAI的Sora、Supermicro等。
Thumbnail
BigQuery 是 Google 推出的無伺服器資料倉儲方案,內建有查詢引擎(類似於 SQL),查詢引擎除了可以方便管理外,也能夠在短時間內對數 TB 的數據進行撈取。相較於其他的資料倉儲解決方案相比,它的成本較低,但如果你的資料量太大有可能成本還是超出你的預期
Thumbnail
對於許多企業而言,試算表是日常業務和決策過程中不可或缺的工具。它們被用於各種目的,從財務預算和盈虧分析到庫存管理和客戶數據記錄。然而,隨著業務的發展和數據量的增加,許多人會發現自己面臨著試算表管理和維護的挑戰,這些挑戰可能妨礙效率、準確性和生產力。 1. 數據管理的繁瑣性 試算表中數據的輸入
Thumbnail
商業簡報不僅僅是呈現數據,更需要深入瞭解數據分析及有效的工具運用。本文探討於Excel中使用不同函數來改善數據處理效率,包括IF、IFS、VLOOKUP、XLOOKUP及INDEX與MATCH的結合,幫助商業人士更好地從數據中提取洞見,助力業務增值,學習優化數據分析過程,讓您的商業簡報更具影響力。
Thumbnail
Supermicro, Inc.為AI、雲端、儲存和 5G/邊緣領域的全方位 IT 解決方案製造商,宣布推出可搭配NVIDIA Omniverse™平台的全新SuperCluster,擴增其SuperCluster隨插即用AI基礎架構解決方案組合,並能提供企業級的高效生成式AI強化型3D工作流程。
Thumbnail
Power BI 是微軟開發的商業智能工具,專為數據可視化和分析設計。它能整合多種數據來源,並將數據轉化為互動式圖表和報表。支持即時更新的儀表板和自然語言查詢,讓用戶快速獲取洞察。其協作和分享功能方便團隊合作,而移動應用支持隨時隨地訪問數據。可以幫助企業做出數據驅動的決策,提高業務效率和競爭力。
Thumbnail
想製作看起來專業又精美的圖表嗎?面對一堆數據卻不知該如何報告嗎? Graphy絕對能滿足你的需求! Graphy是一個提供圖表製作、數據分析等功能的AI工具,讓使用者能夠快速創建和分享數據視覺化的內容,使報告製作變得更加高效、易於理解,無需複雜的整合或廣泛的學習。
Thumbnail
本文介紹了如何使用資料樞紐分析的功能來整理所需的資料,並設定圖表的中文字型,最後提供了繪圖的程式碼範例。
Thumbnail
Tableau是一款數據視覺化工具,目的在於簡化數據分析和決策過程。通過直觀的可視化介面,讓人們無需編程也能進行數據探索和分析。支持多種數據源,包括Excel、SQL數據庫等,透過拖放操作創建圖表和儀表板,分享洞察見解。幫助使用者和組織更加數據驅動,優化決策和業務流程
Thumbnail
本篇文章介紹了智能投資、科技與金融的結合,以及相關的投資策略與市場趨勢。內容涉及科技產品的市場需求與供應、個人生活與體悟、產業分析與市場觀察、臺股市場表現與個人心態、AI技術發展等各方面。文章中提到了一些公司和產品的名稱,如OpenAI的Sora、Supermicro等。
Thumbnail
BigQuery 是 Google 推出的無伺服器資料倉儲方案,內建有查詢引擎(類似於 SQL),查詢引擎除了可以方便管理外,也能夠在短時間內對數 TB 的數據進行撈取。相較於其他的資料倉儲解決方案相比,它的成本較低,但如果你的資料量太大有可能成本還是超出你的預期
Thumbnail
對於許多企業而言,試算表是日常業務和決策過程中不可或缺的工具。它們被用於各種目的,從財務預算和盈虧分析到庫存管理和客戶數據記錄。然而,隨著業務的發展和數據量的增加,許多人會發現自己面臨著試算表管理和維護的挑戰,這些挑戰可能妨礙效率、準確性和生產力。 1. 數據管理的繁瑣性 試算表中數據的輸入