【R語言資料分析】電力資訊視覺化,看歷年來台灣電力結構轉變

更新於 發佈於 閱讀時間約 6 分鐘
本篇目標:帶大家手把手透過R語言完成一份資料視覺化作品
本篇適合:對資料新聞、資料分析有興趣的人;初學R語言的人
本篇需求:對R語言的 dplyr、ggplot 套件有一定了解的人,若您尚未接觸過也沒關係,可以跟著以下的文章試著做做看,也可以有些心得!
本篇重點:
  • 學習使用 R 語言 dplyr 套件。
  • 學習善用 ggplot 細節功能,做出漂亮圖表
  • 學習製作area plot(堆積圖)
  • 學習運用嵌入中文字型功能,讓圖表不亂碼!
紐約時報曾經於2018年12月製作過「How Does Your State Make Electricity?」專題,探討從2001-2017年美國各州電力系統結構變化。本篇目的旨在仿照紐約時報的做法,也製作一個屬於台灣的電力結構轉變資訊圖表。
本篇可能因為付費牆關係無法正常收看,也可以點選下方連結
該篇文章是要探討歷年來(2001年至2017年)全美國(整體)及美國各州(局部)的發電燃料來源,畫出 stacked area plot(堆疊面積圖),此外會依照比例由高至低排,因此可以看到報導圖中,若有某種發電燃料來源比例激增,該區塊變會竄升至圖表上方,反之亦然。這樣的操作確實可有助於了解每個發電燃料來源在該年度的發電占比,以及歷年來的升降幅度。

談談資料來源

本次找到的台灣的資料是從政府開放資料下載而來,有每個月的發電資料,然而因為台灣的發電有分台電本身(發電業)及自用發電設備,因此資料還需要加以處理(數值相加)。
美國資料同樣也有每個月的發電資料,且單位也與台灣使用的相同(1000MWh = 百萬度),但是美國因為幅員遼闊,可能以各州之發電燃料來源之資料可能較有新聞意義。

資料清理

觀察台灣電力供需表資料(csv檔):
下方將命名這份檔案為"elec.csv"
可以發現它還算是一個蠻整齊的資料,不過為求資料讀取效率及後續視覺化需求,我們還是需要對這筆資料做一些處理。
因為這個表格提供相當詳細的資訊,我們可能需要處理兩件事情:
  1. 該表除了「發電(供給)量」,其實也有「用電需求量」的許多欄位,雖說是一個值得使用的欄位,只是這次暫時不列入討論範圍之中。有興趣的人可以試著在這次實作過後也操作看看。因此在資料前處理時我們應該要可以先去除掉這些欄位。
  2. 我們須依照「發電種類」做分別,因此做一些調整,如太陽能發電有分「發電業」與「自用發電設備」,應該要將兩個欄位相加。

套件引入

options(stringsAsFactors = F)
options(scipen = 999) # 取消科學記號
library(tidyverse) # 引入tidyR相關套件,如dplyr等
library(lubridate)

讀取資料

透過 dplyr 套件中的 read_csv(),可以將該csv檔讀入環境當中,並儲存為tibble格式。
base R 其實也有「read.csv()」的函式,會儲存為dataframe格式,但個人建議如果現在要用 tidyR 風格,就盡量全數統一風格,以 tidyR 方式操作。下方也提供相關介紹連結給大家。
raw_us <- read_csv("elec.csv")

選取欄位

使用dplyr 中 select() 函數,選擇欄位,並為每個欄位取英文名稱。

重新整理表格

依照「發電種類」做分別,將「發電業」與「自用發電設備」相加,使用mutate()函數。
(不過,其實也可以在上一步就做這件事,在此我們先分開做,讓各位有所了解)

繪製長表格

製作長表格是資料視覺化相當重要的步驟,利用gather()函數繪製長表格,並將每個年度進行年平均,作為該年度的數據,並計算電力個發電種類發電量比例。
長表格解說:
結果:

製作發電資訊「年平均」、計算各個發電占比

使用group_by()、summarize()和mutate()函數,製作發電資訊年平均,並計算各個發電占比。
此外,因為數據中有些許2022年(當年度)的資料,我們想先去除不看:
結果:

資料視覺化 — — 進階 ggplot 操作

作圖為了模仿紐約時報,x軸將設定為年度,y軸為發電占比。
顏色採用部分,紐約時報似乎有盡量採用該燃料「類似」的顏色,如Coal(煤炭)使用土灰色、水力發電使用淺藍色等,但也只是大致如此,因此我們也盡量模仿紐時,顏色也盡量特別設定。
此外,為了使ggplot好看好讀,因此有許多手動設定,以下會一一介紹。
但首先,我們想針對「中文字型」做一些設定。
而中文字型如何操作,我也做了一個簡單的小筆記,有興趣也可以看看!
接著就是繪圖,把圖表畫出來:
scale_fill_manual() :一一設定每個堆疊的顏色
labs():設定圖表標題、圖表副標題、x軸文字、y軸文字
theme_minimal():選用minimal的ggplot主題
theme()內也有很多參數,包含:圖表標題、子標題、圖表框線、圖表x,y軸文字格式等。
最後「+th」代表將前面我們所設定的中文字型納入。
視覺化完成!
上面是將「發電佔比」進行視覺化,不妨大家也可以試試看「發電量」如何視覺化,結果如下:
如果想看詳細 coding 檔案操作,可至下方連結索取:
資料整理後可發現,這份台灣資料提供蠻多發電類別資訊。
值得一提的是,台灣從2020年至今,每年總發電量逐年攀升。
另外,可以看到燃煤發電之總發電量佔比近年來逐年微幅降低,燃氣發電之總發電量佔比逐年提高(與美國同),然而台灣的核能發電近年來佔比逐年降低,太陽能發電佔比逐年提高,應與當前蔡英文政府w推動之能源政策有關(燃氣50%-燃煤30%-綠能20%)。
不過由於本篇工具限制的關係,我們僅製作出 stacked area plot,並沒有再特別將之由高到低自動的排序。
即將進入廣告,捲動後可繼續閱讀
為什麼會看到廣告
avatar-img
64會員
75內容數
加入沙龍追蹤 CT 更多文章!
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
媒體報導兩岸局勢令人擔憂,可能影響台積電製程工序和供應商,以及生產所需的EUV和電力。文章指出,即使台積電工程師被救走,仍難以在美國或其他國家生產。此外,影響可能擴及全球,特別是外資持有大部分台積電股票。文章指出有這些資料都可以在網路上找到。
MoneyDJ新聞 2024-05-08 12:08:57 記者 賴宏昌 報導 Thomson Reuters報導,根據美國能源情報署(EIA)週二(5月7日)發布的短期能源展望報告(STEO),美國電力消耗將在今明兩年創下歷史新高。EIA指出,2022年發電量為破紀錄的4.067兆千瓦時(kWh
Thumbnail
最近有很多美國的客戶想了解AI運算造成的電力需求大幅提升, 對產業或股價的影響?是否有一些基本的根據來計算, 得出對電力股的股價合理估值在哪裡?
Thumbnail
根據新聞,美國新增了大量再生能源,但電網限制導致只有少部分電力可吸收。建議應更有彈性的法規、短期間儲能及住宅搭配儲能可能是解決方案。
Thumbnail
筆記-阿信老師-重電與生技產業-24.04.05 *重電類股,華城、士電,股價強勢, 美國的變壓器進口需求,預期在美國2027年達到高鋒,看起來還有3年的好光景, 然而必須考慮基期問題,2025的美國變壓器進口需求相較於2024有高成長, 但2026比起2025的成長幅度將放緩。 --變壓
Thumbnail
記得疫情剛剛開始時,美國在無限量化寬鬆之後,導致各類資產消耗品的價格暴漲,再加上烏俄戰爭變成催化劑,讓通膨大大影響民眾。不過現階段從美股的各大指數來看,看起來受到通膨的影響越來越少,主要除了美國本身是世界科技的領導人以及創新以外,同時聯準會也有把通膨轉嫁到全世界的魔法。現在在AI的浪潮下,台灣也有幸
美國人有美元霸權當工具,透過美元操作讓全世界吸收美國政府的虧損. 台灣可以學習美國, 我們沒有貨幣霸權, 但是有半導體先進製程霸權. 台灣可以學習美國,讓外國人替我們買單.台電過去多年累計鉅額的虧損, 接下來每年還會再虧3000-6000億,不如把這些虧損全部轉嫁給台積電及他的上下游廠商,
Thumbnail
巴西目前已有超過八成的電力來自可再生能源。其中最主要是水力,占了總發電的一半,全巴西共有十一個州 + 聯邦特區 (DF) 的主要電力來源都是水力。
Thumbnail
「每天五分鐘 了解時事又學英文」 核能發電的議題在台灣及國際上的討論聲浪都不曾間斷,而在本文會用英文短文來聊聊核能發電的優劣勢,帶你了解國際議題的同時又能學習英文。
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
媒體報導兩岸局勢令人擔憂,可能影響台積電製程工序和供應商,以及生產所需的EUV和電力。文章指出,即使台積電工程師被救走,仍難以在美國或其他國家生產。此外,影響可能擴及全球,特別是外資持有大部分台積電股票。文章指出有這些資料都可以在網路上找到。
MoneyDJ新聞 2024-05-08 12:08:57 記者 賴宏昌 報導 Thomson Reuters報導,根據美國能源情報署(EIA)週二(5月7日)發布的短期能源展望報告(STEO),美國電力消耗將在今明兩年創下歷史新高。EIA指出,2022年發電量為破紀錄的4.067兆千瓦時(kWh
Thumbnail
最近有很多美國的客戶想了解AI運算造成的電力需求大幅提升, 對產業或股價的影響?是否有一些基本的根據來計算, 得出對電力股的股價合理估值在哪裡?
Thumbnail
根據新聞,美國新增了大量再生能源,但電網限制導致只有少部分電力可吸收。建議應更有彈性的法規、短期間儲能及住宅搭配儲能可能是解決方案。
Thumbnail
筆記-阿信老師-重電與生技產業-24.04.05 *重電類股,華城、士電,股價強勢, 美國的變壓器進口需求,預期在美國2027年達到高鋒,看起來還有3年的好光景, 然而必須考慮基期問題,2025的美國變壓器進口需求相較於2024有高成長, 但2026比起2025的成長幅度將放緩。 --變壓
Thumbnail
記得疫情剛剛開始時,美國在無限量化寬鬆之後,導致各類資產消耗品的價格暴漲,再加上烏俄戰爭變成催化劑,讓通膨大大影響民眾。不過現階段從美股的各大指數來看,看起來受到通膨的影響越來越少,主要除了美國本身是世界科技的領導人以及創新以外,同時聯準會也有把通膨轉嫁到全世界的魔法。現在在AI的浪潮下,台灣也有幸
美國人有美元霸權當工具,透過美元操作讓全世界吸收美國政府的虧損. 台灣可以學習美國, 我們沒有貨幣霸權, 但是有半導體先進製程霸權. 台灣可以學習美國,讓外國人替我們買單.台電過去多年累計鉅額的虧損, 接下來每年還會再虧3000-6000億,不如把這些虧損全部轉嫁給台積電及他的上下游廠商,
Thumbnail
巴西目前已有超過八成的電力來自可再生能源。其中最主要是水力,占了總發電的一半,全巴西共有十一個州 + 聯邦特區 (DF) 的主要電力來源都是水力。
Thumbnail
「每天五分鐘 了解時事又學英文」 核能發電的議題在台灣及國際上的討論聲浪都不曾間斷,而在本文會用英文短文來聊聊核能發電的優劣勢,帶你了解國際議題的同時又能學習英文。