Python 的 50+ 練習:資料科學學習手冊

2021/12/23閱讀時間約 6 分鐘

Yet another Python course

在設計「Python 的 50+ 練習:資料科學學習手冊」過程中,我時不時會做一些反省檢視,多半都是問自己同一個問題「各個線上課程平台,包含將要上架的 Hahow 好學校,已經有相當數量的 Python 課程,再開一個是不是在重複造輪呢?」
我想不是的,否則應該只會有一本 Python 書或者一個 Python 課程,很有可能是作者荷蘭電腦科學家 Guido van Rossum 或者 Python.org 所撰寫、所開設的,而不是像現在市面上玲瑯滿目的書籍與課程;每一個作者或者講師都在試圖用過來人的角度重新詮釋他們學習過程的體悟,遇到投緣的讀者或學生,就能產生好的學習效果。某個程度來看跟事業的選擇也類似,有時候不一定是考慮藍海或者紅海市場,也不一定是考慮競爭或者門檻,否則早些年的 Yahoo! 拍賣、露天拍賣與 PCHome 應該仍是我們雙十一、雙十二等各種購物促銷活動的首選平台,而非此刻的 Momo 購物與蝦皮購物。
早些幾年的時候會傾向要求自己去找出我的課程「比」別人的課程好的賣點是什麼,最近幾年則是更溫和了點,現在的想法是:Hahow 好學校上頭有讚譽有加的 Python 課程都很棒,我所設計的「Python 的 50+ 練習:資料科學學習手冊」希望能和這些好老師的好內容看齊,造福好學生。大概不是因為年紀大了變得鄉愿,應該是體悟到透過「比較、壓倒」倚賴外在來源所獲得的優越,難以跟內在藴育養成對自我價值的評估抗衡。

課程亮點

2020 年春季我開始以兼任講師的身份在台大共同教育中心、工管系與師大企管系開設長度是一個學期、共計三學分的選修課程,為了能適當地幫學生評分,我開始設計作業、考試以及批改測試,授課過程重新體悟國、高中時間上數學課,老師耳提面命地提醒「上課聽懂不代表就會了,要大量解題才能融會貫通」的精神。
學習程式設計與資料科學應用光是上課聽觀念講解以及進行範例操作還不夠,必須要再加上親自思考並且寫作練習題才能夠有良好的學習效果,因此從「SQL 的 50 道練習」開始,就設計了以 Exercise Based Learning 以練習作為基底的 LPAA 教學模型,把每個章節都設計成一個 Learn-Practice-Apply-Assess 的循環,期望在線上課程單向的教學中融入從做中學(Learning by doing)的機制。
資料分析師在工作時容易被詬病「無法寫作可重複使用的程式碼」,這除了跟多數的資料分析師為跨領域背景、撰寫程式時沒有寫作函數、類別的習慣有關,所以課程的所有練習題都規定要以函數或者類別完成,這個要求雖然無形提高了初學者的進入門檻,但在設計時提供了函數命名、參數命名以及結構模板,再搭配練習題詳解教學影片,學生除了能夠學到資料科學應用,在程式設計部分也能打下扎實的基本功。
一開始的課程命名是 Python 的 50 道練習,希望能夠和上一堂廣受好評的 SQL 的 50 道練習呼應,未來可以慢慢地積累其他 XXXX 的 50 道練習,成為我自己開設資料分析、程式語言課程的一個品牌系列,不過由於課程規劃了四大部分、二十個章節:
  1. Python 程式設計的基礎觀念:包含資料類別、資料結構類別、流程控制以及函數。
  2. Python 程式設計的進階觀念:包含類別、模組、Comprehensions、Generators、迭代器函數、函數型函數與環境管理。
  3. Python 資料科學的基礎:包含 NumPy、Pandas、Matplotlib 以及 Scikit-Learn 四個重要的資料科學模組。
  4. 資料科學的應用場景:包含資料載入、資料框操作、文字資料的操作、日期時間資料的操作、探索性資料分析與監督式學習。
覺得很難用五十題左右的練習題就能規劃完成,但是又不想要破壞 XXXX 的 50 道練習的品牌系列命名,靈機一動(萬分感謝給我超棒點子的老婆大大),調整成了 50+ 練習,只希望也有大佛之於大佛普拉斯萬分之一的微妙,事實上一個章節再怎麼精簡設計十道練習,也是將近兩百題的總數。

課程緣起

以程式處理、分析資料並且挖掘洞見的人才一直是職場上炙手可熱的經典款,他們從事將資料(Data)提煉為資訊(Information)的資料科學相關工作,包含取得資料、操作資料、探索資料、訓練模型來預測資料、溝通分享以及正式部署等場景,由於這些過程多半伴隨著重複性、自動化與規模化的要求,使用程式來實現就成為了現代資料科學的定義,因此從實務角度入門資料科學,必定要學習程式語言及如何透過該語言實踐各個資料科學應用場景。
根據資料科學家社群 Kaggle 在 2021 年針對網站會員所發出的問卷, Python 在資料科學家日常頻繁使用語言中排名第一、在資料科學家最推薦新手第一個去學習的語言中排名第一,學習 Python 程式設計與資料科學應用的重要性不言可喻。

行動呼籲

我希望透過在好學校開設「Python 的 50+ 練習:資料科學學習手冊」,讓學生一步步完成這門課程所有的觀念講解、範例實作以及練習之後,扎實地將 Python 程式設計與資料科學應用納入自己的技能組,成為一位擅長寫程式處理資料的分析師,大幅提升工作掌握度與職涯發展性!如果您是符合下列描述的初學者:
  • 日常生活(包含工作、興趣、學習或研究)需要處理以及分析數據。
  • 對於數據分析、資料科學有興趣,未來想從事相關工作(資料分析師、資料工程師、資料科學家)。
  • 喜歡透過動手做練習題學習知識與技能。
邀請您加入我的 Hahow 好學校課程「Python 的 50+ 練習:資料科學學習手冊」,募資已經達標,預計於 2022–03–15 正式開課!

延伸閱讀

郭耀仁
郭耀仁
是一位資料分析師、也是資料科學的專業講師,現於台大工商管理學系、台大共同教育中心與師大企業管理學系兼任講師。創立「數據交點」基於「慢慢變強,克服程式設計與資料分析的學習焦慮」的核心理念,提供個人服務以及企業服務,閒暇時喜歡長跑與寫作。
留言0
查看全部
發表第一個留言支持創作者!