資料處理

含有「資料處理」共 47 篇內容

全部內容

發佈日期由新至舊

PHANKO 數據工作室

2026/04/06

PHANKO 在做什麼？| 把混亂數據「一鍵超渡」，化為乾淨好用的 Excel

許多人詢問我的服務內容，簡單來說，就是將難以理解的數據，轉換成可以直接使用的格式。以一個實際案例，說明如何數據處理再做什麼

#案例 #客戶 #AI工具

加木，隨意聊

2026/03/09

『關於AI那些事：資料潔癖』

相信許多人家裡，或者辦公室某個角落，都有一個神秘的抽屜。裡面塞滿了各種不明配件，十年前的滑鼠、從來沒用過的螢幕轉接頭、還有數條已經泛黃發黏的USB線。我們總覺得「留著吧，說不定哪天會用到」，但那一天，跟我的樂透頭獎一樣，從來沒有來過。或打開你的電腦桌面，是否有幾個檔名類似：「新增

#資料潔癖 #AI #資料處理

付費限定

Chris Fung 的沙龍

2026/01/19

善用 Carrot2 自動分類 Instapaper 書籤，告別雜亂的「稍後閱讀」清單

Instapaper 書籤越堆越多，每次想找特定主題時卻像大海撈針？本文介紹如何運用開源文件聚類工具 Carrot2，自動分析您的 Instapaper 導出資料，將龐雜的閱讀清單分組成清晰的主題類別，大幅提升閱讀效率與知識管理能力。

含 AI 應用內容

#個人知識管理 #稍後閱讀 #生產力工具

Chris Fung 的沙龍

2025/12/31

Instapaper Scraper v1.1 正式發布：輕鬆匯出閱讀清單，讓知識管理更智慧

Instapaper 的「稍後閱讀」文章難以整理？開源工具 Instapaper Scraper 讓你輕鬆將書籤匯出成 CSV、JSON 或 SQLite 格式，支援可點擊連結，提升使用體驗與效能。適合資料分析、筆記軟體匯入、知識備份的使用者。立即體驗，一同優化知識管理！

含 AI 應用內容

#Python #開源 #免費工具

Ethan的AI學習筆記

2025/12/07

《從零開始的資料科學筆記》Day#22: 機器學習進階技巧四

📚 降維技術降維是將高維數據轉換為低維表示的過程，同時保留數據的關鍵信息。這一技術對於現代機器學習至關重要，因為：降低複雜度：減少特徵數量，簡化模型，加速訓練消除冗餘：移除高度相關特徵，提高模型穩定性減輕維度災難：在高維空間中，數據變得稀疏，距離度量失去意義視覺化：將高維數據投

#數據 #程式 #迴歸分析

Ethan的AI學習筆記

2025/11/22

《從零開始的資料科學筆記》Day#21: 機器學習進階技巧三

🧲 特徵轉換方法特徵轉換是調整數值型特徵分布形態的過程，幫助模型更有效地學習和提高預測性能。良好的特徵轉換可以：改善數據分布：使偏斜分布更加對稱降低異常值影響：減少極端值對模型的干擾捕捉非線性關係：讓線性模型可以學習複雜模式提高訓練穩定性：加速梯度下降收斂過程

#迴歸分析 #數據 #程式

Ethan的AI學習筆記

2025/11/08

《從零開始的資料科學筆記》Day#20: 機器學習進階技巧二

🪛 特徵編碼為什麼需要特徵編碼? 特徵編碼是將非數值型資料（如類別、文本等）轉換為數值形式的過程，這是機器學習模型處理資料的必要步驟，因為：模型數值需求：大多數機器學習算法只接受數值輸入，無法直接處理文字或類別資料語義保存：編碼過程必須保留原始類別的語義信息，不同編碼方式會保留不同的

#迴歸分析 #資料處理 #數據

Ethan的AI學習筆記

2025/10/24

《從零開始的資料科學筆記》Day#19: 機器學習進階技巧一

大家應該都實際練習過機器學習的四大技術了，包含迴歸分析、分類分析、分群分析以及時間序列分析。在機器學習模型的開發過程中，我們常將焦點放在演算法的選擇與模型的訓練上，但實際上，一個高效且穩健的模型，往往取決於資料的前處理與特徵的設計。隨著模型複雜度提升，過擬合、特徵尺度不一致以及高維資料噪聲等問題會

#機器學習 #程式 #資料處理

Ethan的AI學習筆記

2025/10/11

《從零開始的資料科學筆記》Day#18: 資料具有時間特性怎麼訓練?

在現實生活中，許多資料並非靜止的，它們會隨著時間不斷變化，形成了一種特殊的資料型態，這就是時間序列資料。時間序列數據廣泛存在於各種領域，如金融市場的股票價格波動、氣候監測的溫度變化、製造業的機器故障檢測，以及網站流量的每日訪問量等。這些資料的最大特點在於：當前的觀測值與過去的值密切相關，未來的趨勢也