踏入數據分析領域必備:Side Project的準備

更新於 發佈於 閱讀時間約 6 分鐘
  在之前的文章中,分享了我從公務員轉職到資料科學家的歷程,其中大大增加我履歷亮點的,就是大量的專案經驗,也就是大家稱的Side Project。這篇文章,想要分享Side Project為何、規模應該多大、方向怎麼找、在職期間怎麼找時間規劃完成自己的專案......等,希望可以給讀者一些更具體的想法!

Side Project是什麼

  關於Side Project是什麼、如何開始,我詢問了ChatGPT給出以下回答。
ChatGPT對Side Project的理解
  對我而言,Side Project是在正職以外自己進行的專案,不管是靈光一現的靈感,或是遇到問題的解方,都可以成為自己獨特的Side Project。Side Project 重要之處在於,因為作品能幫你說話。尤其是轉職前沒有相關工作經驗,Side Project就可以大大提升說服力,讓人一看履歷就相信你具備技術能力。
  如果上面ChatGPT的回答你都看得懂,那恭喜,你已經是可以獨當一面的數據分析師了,接下來只缺一個資料、一個靈感、一股衝勁,就可以完成很棒的專案。
  如果ChatGPT的回答看完還是覺得很迷茫,那沒關係,接下來我會分享一些做專案的心得,試圖解決大家心中的困惑。

Side Project方向怎麼找

  如果是要接觸數據分析、資料科學相關的領域,一開始一定會苦於找不到專案的方向,這時,可以從生活中的問題下手,例如:返鄉買高鐵票好苦惱,這時可以寫一個簡單的爬蟲專案,自動化買票的流程;找租屋/買房時找不到CP值高的房子,可以透過政府Open Data中的實價登錄資料,分析影響租房/買房價格的因素,試圖找到合理的價格。
  另外,若想做資料分析專案,卻苦於沒有資料,可以上政府開放資料平台,上面也可以看到一些公開的加值應用;或是上Kaggle,裡面有許多比賽,有各種的資料可以玩,不同的任務要達成,更重要的是,通常都會有許多人分享他們的code與分析邏輯,是一個充滿寶藏的地方。
  這邊跟大家分享幾個我曾經玩過的Kaggle競賽,在裡面學到了很多資料處理、建模分析的技巧:
  接著,站在技術層面,我整理出幾個資料分析相關專案常見的分類,可以參考。
  • 資料分析專案:包括結構化資料分析、自然語言處理(NLP)等,可以在專案中實踐從定義問題、資料探索性分析、資料前處理、建模分析,到結果詮釋,這一連串的流程,展現對資料分析的掌握度與理解力。
  • 影像辨識專案:包括影像分類、物件偵測等,可以結合生活中的議題實作,例如實作抽菸辨識,若辨識出抽菸則發出訊號;做食物分類,計算熱量提供使用者飲食營養參考。
  • 網路爬蟲專案:網路爬蟲範疇很大,除了從網頁上抓取想要的資訊外,也可以實踐自動化買票、自動化操作社群等等,只要有簡單的操作概念,就可以變化出各種應用。
  • 流程自動化專案:善用程式自動化工作流程,例如,偵測股票價格,到價值點時自動傳Line通知、自動化整理報表、生成例行性簡報(PPT)等。
  以上這些專案只是大略的分類,若還找不到方向,不妨找個有興趣的類別開始學習相關技術、發想有趣議題,開始自己的Side Project吧。

做Side Project需要的程式能力

新手也可以完成Side Project!

  想做自己的專案,我覺得並不需要累積多強的程式能力,甚至有基礎的程式能力,透過ChatGPT的協助,也可以完成一個有趣的專案。舉個例子,你可以從一些券商的網站找到上市櫃公司的年報/季報,你想要把有興趣的財務指標抓下來,作為投資決策參考,並傳到Line上。此時,可以問ChatGPT如何爬取網頁資訊,它可能會告訴你可以使用Python的BeautifulSoup套件完成;問ChatGPT如何傳到Line,他可能會教你用Line Notify傳送或是建構Line Bot。如此一來便完成一個專案了。
  因此,我建議不要猶豫,新手就可以開始做 Side Project。做專案的過程中,可以讓你直接應用所學、累積技術,之後更能協助你抵達求職彼岸,甚至找到寫程式的樂趣,持續進步前行。
你不需要很厲害才開始,但開始了才會變得厲害。

怎麼知道做的專案有沒有價值

  我認為好的專案不一定是蘊含很深的技術能力,更重要的是如何定義問題,並用程式解決問題。另外,面試的時候,常被問到是專案背後的動機、解決問題的思路、是否遇到什麼困難以及如何解決,最後是專案帶來的效益。因此,我認為一個有價值的專案,就是說得出故事的專案,
透過每次的 Side Project 讓自己一點一滴累積成長,這就是最大的價值。

如何在職完成Side Projects

  在職期間要完成Side Project,對很多人來說是個挑戰。但我在職將近1年半的時間,至少完成10件可以放作品集的Side Project,關於如何有效率完成專案,我想歸納成四點分享給大家。
  1. 目標導向:因為Python跟R有許多模組可以實現不同的目標,所以在學習Python或R時,在掌握基本概念後,我通常會以目標導向進行學習,例如:我想學習如何用Python爬蟲,就去學習BeautifulSoup與selenium模組的用法,這樣也可以累積實力的同時,也完成自己想做的小專案。
  2. 從過去的作業/小專案延伸:過去的所有成果都有其價值,因此可以試著延伸過去所做的小程式,甚至將它們串在一起也許就能成為一個專案。
  3. 改寫程式:網路上有很多大神寫的程式碼,例如在Kaggle、Github上很多人會分享code,所以可以改寫別人的code,用不同方法實現同個目的,或是優化績效等等。
  4. 多專案並行:在做Side Project的過程中不免會遇到難關,有時候會卡住一段時間,因此我習慣多專案並行,若暫時找不到解方,就先構思或進行下一個專案,或是同個專案的其他部分。我習慣在做專案時用To-do list的方式,訂定項目與階段性目標,達成了就可以劃掉,這樣不僅可以追蹤自己的目標,也可以清楚區分所有想做的事情。

總結

  謝謝大家閱讀到最後,在做專案的過程,其實最重要的還是熱情,要相信自己的Side Project很有趣,做的是好玩的東西,有熱情投入,一定能在每次做Side Project的過程中不斷成長,並且能講出動人的故事。
為什麼會看到廣告
avatar-img
66會員
6內容數
公務員是我的第一份正職,從高考榜首到離開公務員,跨領域轉職到資料科學家,公務員的經歷、所學、轉職的心路歷程等,在「關於公務員,我想說的是」專題中,一一跟大家分享
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Fann的沙龍 的其他內容
大學讀會計系,雙主修社會系,研究所讀農業經濟,課餘時經營程式接案工作,畢業後,踏上了將近1年半的公務員生活,之後毅然辭職,離開公務界,即將成為一名資料科學家 (Data Scientest)。這篇文章想簡短分享跨領域之路,主要著重在這段旅程是怎麼開始的,當中經歷了什麼,而我又學到了什麼。
大學讀會計系,雙主修社會系,研究所讀農業經濟,課餘時經營程式接案工作,畢業後,踏上了將近1年半的公務員生活,之後毅然辭職,離開公務界,即將成為一名資料科學家 (Data Scientest)。這篇文章想簡短分享跨領域之路,主要著重在這段旅程是怎麼開始的,當中經歷了什麼,而我又學到了什麼。
你可能也想看
Google News 追蹤
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
這篇文章分享了作者在參與預估專案時的思考脈絡和學習點,透過兩個具體的案例,探討了預估方法中重要的假設和挑戰。
我畢業於台大工管系,考取清大心諮所。想透過這篇文章,分享幫助我在諮商演練的過程中進步的心法。
Thumbnail
在我剛開始寫程式的時候,深切地感受到要學的東西實在太多了,尤其在課堂上學的東西跟在公司要打造產品的技能非常的不一樣,有非常多需要自學的地方。 在我剛開始實習的時候,除了看書、看文章、用線上網站練習新語言的語法,我覺得幫助我最多的就是直接練習寫一個 Side project 了。
轉職數據分析師是一項需要長期努力的過程。對於文組生來說,由於缺乏數學、統計、程式設計等方面的基礎,在轉職過程中往往會面臨更多的挑戰。因此,制定一個合理的學習計劃,對於提高轉職成功率至關重要。 以下是一些規劃轉職數據分析師學習進度表的建議: 第一步:確認你的優勢和劣勢 在開始學習之前,我們首先要
Thumbnail
探索職涯發展需要適時進行 A/B 測試和數據分析,以找出最佳策略。本文討論瞭如何在人生重大決策中運用 A/B 測試的觀念,以及 20/80 法則在職涯和專案管理上的重要性。此外,數據和了解用戶需要同等重要,並探究了目標設定和修正的策略。文章中提供了豐富的例子和建議,適合職場新鮮人參考。
Thumbnail
有別於試圖直接從數據中找出洞察,商業分析的精髓在於先思考 so what——從定義目標開始,做出商業決策的雛形後,才用數據去支持假說。這篇文章介紹 A/B 測試的技巧,以及摘櫻桃的應用,解說數據篩選的操作、摘櫻桃的好處,以及企業案例:數位轉型後的報社,亞馬遜CEO貝佐斯改造百年郵報。
Thumbnail
這是文科轉職數據工程師系列的第一篇文章。 許多人會在轉職前上許多數據分析課程,該怎麼選擇比較適合自己,但又不會噴錢呢? 這篇文章要介紹這個轉職過程前的準備工作。
Thumbnail
現代社會跟以前不同了,人人都有一支手機,只要打開就可以獲得各種資訊。過去想要辦卡或是開戶就要跑一趟銀行,然而如今科技快速發展之下,金融App無聲無息地進到你生活中。但同樣的,每一家銀行都有自己的App時,我們又該如何選擇呢?(本文係由國泰世華銀行邀約) 今天我會用不同角度帶大家看這款國泰世華CUB
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
這篇文章分享了作者在參與預估專案時的思考脈絡和學習點,透過兩個具體的案例,探討了預估方法中重要的假設和挑戰。
我畢業於台大工管系,考取清大心諮所。想透過這篇文章,分享幫助我在諮商演練的過程中進步的心法。
Thumbnail
在我剛開始寫程式的時候,深切地感受到要學的東西實在太多了,尤其在課堂上學的東西跟在公司要打造產品的技能非常的不一樣,有非常多需要自學的地方。 在我剛開始實習的時候,除了看書、看文章、用線上網站練習新語言的語法,我覺得幫助我最多的就是直接練習寫一個 Side project 了。
轉職數據分析師是一項需要長期努力的過程。對於文組生來說,由於缺乏數學、統計、程式設計等方面的基礎,在轉職過程中往往會面臨更多的挑戰。因此,制定一個合理的學習計劃,對於提高轉職成功率至關重要。 以下是一些規劃轉職數據分析師學習進度表的建議: 第一步:確認你的優勢和劣勢 在開始學習之前,我們首先要
Thumbnail
探索職涯發展需要適時進行 A/B 測試和數據分析,以找出最佳策略。本文討論瞭如何在人生重大決策中運用 A/B 測試的觀念,以及 20/80 法則在職涯和專案管理上的重要性。此外,數據和了解用戶需要同等重要,並探究了目標設定和修正的策略。文章中提供了豐富的例子和建議,適合職場新鮮人參考。
Thumbnail
有別於試圖直接從數據中找出洞察,商業分析的精髓在於先思考 so what——從定義目標開始,做出商業決策的雛形後,才用數據去支持假說。這篇文章介紹 A/B 測試的技巧,以及摘櫻桃的應用,解說數據篩選的操作、摘櫻桃的好處,以及企業案例:數位轉型後的報社,亞馬遜CEO貝佐斯改造百年郵報。
Thumbnail
這是文科轉職數據工程師系列的第一篇文章。 許多人會在轉職前上許多數據分析課程,該怎麼選擇比較適合自己,但又不會噴錢呢? 這篇文章要介紹這個轉職過程前的準備工作。