方格子 vocus

博生的微光日誌 1 資料整理的藝術

永真。預約好生活

2025/04/12 更新2025/04/12 發佈閱讀 3 分鐘

前言--資料不是冷冰冰的，它其實很有個性

在做研究的過程中，有一個階段總是特別安靜，也特別需要耐心——那就是「資料清理」。

這不是跑模型、也不是寫報告，而是與資料慢慢相處、熟悉它每個欄位背後的邏輯與故事。這一階段看似不起眼，卻往往決定了研究的穩定度與深度。

這篇文章，想和你分享我最近的一段研究歷程：

從接手老師的研究室資料庫raw data，一步步清理、理解、重組，到終於開啟分析的那一天。我也會分享一些我自己在資料處理與時間管理上的小策略，特別是當你同時要面對研究與生活、要在等結果的空檔煮飯洗碗、或接小孩上下課、安親的時候。

希望這些經驗，能成為你面對研究資料時的一盞小燈。

資料，其實是一種語言，我們只是需要時間去聽懂它。

一個月的「資料清理生活」

這一個月來，我的生活幾乎都在「認真清 raw data」。直到最近，終於邁入了資料分析與撰寫報告的階段。

或許會有人好奇：為什麼清理資料需要這麼久？

其實，這批資料並不是我親自收集的，而是來自研究室既有的資料庫。這也意味著，我得花更多時間去熟悉資料的內容與邏輯，才能確保後續分析的準確性。

二手資料的快速熟悉--從「認識資料」開始

研究室老師總是會有自己的database，所以對於研究的變項data，就會使用到老師與學長姐前人留下的資料庫資料。在接手別人留下的 raw data，第一步不是跑統計，而是「建立關係」。我花了不少時間做以下幾件事：

確認資料收集的正確性與邏輯：細讀Code-Book，包括變項的編碼方式、變項在表格中對應的符號、是否有一致性、是否有邏輯衝突等。
理解 missing data 的處理方式：每個人處理缺漏值的策略都不同，必須弄清楚前人是怎麼處理的。
重新檢查地理空間變項：由於我的研究與空間資料相關，我自己處理完座標後，我會花時間檢查每一筆座標與地點的合理性(是否需要座標轉換等等)。

這些過程讓我更熟悉資料，也幫助我重新建立資料的「可用性」。

資料也要斷捨離--把 raw data 整理成自己的研究版本

資料熟悉之後，我開始根據自己的研究問題，重新整理變項與分類邏輯。這個階段像是在把一堆雜亂無章的積木，重新拼成自己研究的樣子。

這不只是技術問題，也是一種邏輯轉換：你要知道自己要研究什麼，才能決定哪些變項留下、哪些需要再轉換，哪些分類方式比較符合你的分析策略。

終於開跑：分析的第一步不是跑模型

昨天，正式進入資料分析階段。

但第一步不是丟進模型跑結果，而是先進行各種基本確認：

資料是否近似常態分布？
類別變項的分類是否合適？
空間分佈樣態是否合理、有沒有初步的觀察？

這些步驟雖然不炫技，但卻是研究的地基，穩不穩就靠它們。

時間管理：研究與生活同步進行

從下午兩點開始分析，一路忙到凌晨兩點。這期間，我也穿插處理了不少家事。

我的方法是：「分析在跑的時候，人可以去做別的事。」資料分析有很多等待時間，我就趁機去做其他任務，達成雙線並行、時間不浪費。

我也會在做家事的同時思考接下來要做的事項、研究步驟規劃，之後快速用手機記下並安排to do list。

這也是做研究後慢慢養成的能力之一：如何在有限的時間內分配專注力，找到生活與研究的節奏。

與data約會--資料，是需要「相處」的對象

這次的經驗讓我更深刻體會到：認識資料，是進入研究世界的第一步。

尤其當資料並不是你親手收集，更需要花時間去「理解它」，和它建立關係。因為只有真正了解資料，才能進一步說一個有根據、有力量的研究故事。

總結

對我來說，做量性研究是一對數字的整理，但我認為每一筆資料都是個案的生命故事，我只是用量化的方式，把個案的生命故事整理出來，讓更多人了解一個現象或疾病的樣態。

跑資料是屬於博生的魔幻時刻

留言

永真。預約好生活的沙龍

4會員

12內容數

永真。預約好生活的沙龍的其他內容

2025/04/27

博生的微光日誌2 數字的魔法練習

統計學習的三重境界：從見山是山，到見山不是山，再回到見山是山在研究與統計的世界裡，我最近越來越體會到一種漸進的學習歷程，就像禪宗裡說的那三個階段：見山是山見山不是山見山是山我現在正卡在第二個階段——「見山不是山」的狀態。當統計變得不再「熟悉」碩士時期開始學習系

2025/04/27

博生的微光日誌2 數字的魔法練習

2025/02/16

東京上野輕獨旅-再訪歷史悠久已有150歲的上野公園

東京上野的恩賜公園，擁有150多年歷史，結合自然、歷史與藝術文化，是東京重要的文化藝術聚落。本文介紹上野恩賜公園的歷史、周邊景點，包括歷史建築（寛永寺、上野東照宮、花園稻荷神社）、博物館美術館（東京國立博物館、國立科學博物館、國立西洋美術館等）、音樂文化設施、上野動物園等，適合東京自由行的遊客參考。

2025/02/16

東京上野輕獨旅-再訪歷史悠久已有150歲的上野公園

2025/01/08

函館深度遊：歷史街區、金森倉庫與絕美夜景

2023年8月北海道函館之旅，除了品嚐帝王蟹，更著重於函館夜景、金森倉庫群與歷史保存區的探訪，以及函館蔦屋書店的參觀。文章詳細介紹了函館歷史街區的發展歷程、建築風格、以及金森倉庫群的特色，並分享了作者在函館歷史街區與金森倉庫的遊覽體驗及感受。

2025/01/08

你可能也想看

其實除了研究所需，觀察也是靈感的來源、也可以是日常生活的樂趣。

#觀察#研究#質性

2024/07/20

漫步筆記的沙龍

練習觀察

其實除了研究所需，觀察也是靈感的來源、也可以是日常生活的樂趣。

#觀察#研究#質性

2024/07/20

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：流動、跨域、變形的「生存之道」

當代名導基里爾．賽勒布倫尼科夫身兼電影、劇場與歌劇導演，其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後，他持續以創作回應專制體制的壓迫。《傳奇：帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析，解構賽勒布倫尼科夫如何利用影劇雙棲的特質，在荒謬世道中尋找藝術的「生存之道」。

#釀電影#釀評論#藝術評論

2026/02/28