資料科學

含有「資料科學」共 135 篇內容

全部內容

發佈日期由新至舊

偽命名培養體

2026/03/31

[雜記] 沉澱期五四三｜只是碎碎念

從我現實本體的正式離職日算起，也差不多一個月了，規律的生活步調被迫停下後，一開始還真的有種說不出來的奇怪感，不過或許這樣也好，就當自己的沉澱吧。

#插圖 #速記 #程式

哈斯的採購人生

2026/04/16

Mercteria

發文者

2026/04/18

《炒股不看周月年K漲幅機率就是耍流氓》

2025/12/27

【實作教學】自動化全球股市數據倉庫：GitHub Actions 關鍵變數設定與避坑指南

前言在建置「全球股市數據倉庫 (global-stock-data-warehouse)」時，自動化流程（GitHub Actions）是核心心臟。許多讀者在設定環境變數時常感到困惑。本篇將跳過基本的通知設定（如 Resend 或 Telegram），直接切入最重要的兩大核心變數，並分享一個能幫

含 AI 應用內容

#GitHub #自動化 #股市分析

私釀觀點

2025/12/08

為什麼你的數據像垃圾，別人的數據能變現？揭開韓國最強行銷人「操控人心」的秘密

不想再被老闆問倒？數據不是用來交差的，是用來「讀心」的。車賢那，教你如何用「一個數字」搞定簡報，並從氣溫與時間中找出讓客戶瘋狂下單的秘密。這不是數學課，這是你的生存指南。

含 AI 應用內容

#讓人忍不住手滑下單的數據思維 #車賢那 #數據分析

Ethan的AI學習筆記

2025/12/07

《從零開始的資料科學筆記》Day#22: 機器學習進階技巧四

📚 降維技術降維是將高維數據轉換為低維表示的過程，同時保留數據的關鍵信息。這一技術對於現代機器學習至關重要，因為：降低複雜度：減少特徵數量，簡化模型，加速訓練消除冗餘：移除高度相關特徵，提高模型穩定性減輕維度災難：在高維空間中，數據變得稀疏，距離度量失去意義視覺化：將高維數據投

#數據 #程式 #迴歸分析

Ethan的AI學習筆記

2025/11/22

《從零開始的資料科學筆記》Day#21: 機器學習進階技巧三

🧲 特徵轉換方法特徵轉換是調整數值型特徵分布形態的過程，幫助模型更有效地學習和提高預測性能。良好的特徵轉換可以：改善數據分布：使偏斜分布更加對稱降低異常值影響：減少極端值對模型的干擾捕捉非線性關係：讓線性模型可以學習複雜模式提高訓練穩定性：加速梯度下降收斂過程

#迴歸分析 #數據 #程式

Anna个策略共構視角⦨

2025/11/18

【AI 基礎】⦨資料科學 vs 機器學習 vs 監督式學習

資料科學、機器學習與監督式學習，不只是 AI 技術，而是三種不同的思考模式：資料科學像整理者，先把混亂世界排出秩序；機器學習像實驗者，先做再調整；監督式學習則是兩者的協作，先定義答案，再透過不斷嘗試逼近結果。理解這三種模式，有助於辨識自己的工作習慣與決策方式。

#機器學習 #監督式學習 #資料科學

Ethan的AI學習筆記

2025/11/08

《從零開始的資料科學筆記》Day#20: 機器學習進階技巧二

🪛 特徵編碼為什麼需要特徵編碼? 特徵編碼是將非數值型資料（如類別、文本等）轉換為數值形式的過程，這是機器學習模型處理資料的必要步驟，因為：模型數值需求：大多數機器學習算法只接受數值輸入，無法直接處理文字或類別資料語義保存：編碼過程必須保留原始類別的語義信息，不同編碼方式會保留不同的

#迴歸分析 #資料處理 #數據

Ethan的AI學習筆記

2025/10/24

《從零開始的資料科學筆記》Day#19: 機器學習進階技巧一

大家應該都實際練習過機器學習的四大技術了，包含迴歸分析、分類分析、分群分析以及時間序列分析。在機器學習模型的開發過程中，我們常將焦點放在演算法的選擇與模型的訓練上，但實際上，一個高效且穩健的模型，往往取決於資料的前處理與特徵的設計。隨著模型複雜度提升，過擬合、特徵尺度不一致以及高維資料噪聲等問題會

#機器學習 #程式 #資料處理

Ethan的AI學習筆記

2025/10/11

《從零開始的資料科學筆記》Day#18: 資料具有時間特性怎麼訓練?

在現實生活中，許多資料並非靜止的，它們會隨著時間不斷變化，形成了一種特殊的資料型態，這就是時間序列資料。時間序列數據廣泛存在於各種領域，如金融市場的股票價格波動、氣候監測的溫度變化、製造業的機器故障檢測，以及網站流量的每日訪問量等。這些資料的最大特點在於：當前的觀測值與過去的值密切相關，未來的趨勢也