資料處理

含有「資料處理」共 39 篇內容
全部內容
發佈日期由新至舊
🪛 特徵編碼 為什麼需要特徵編碼? 特徵編碼是將非數值型資料(如類別、文本等)轉換為數值形式的過程,這是機器學習模型處理資料的必要步驟,因為: 模型數值需求:大多數機器學習算法只接受數值輸入,無法直接處理文字或類別資料 語義保存:編碼過程必須保留原始類別的語義信息,不同編碼方式會保留不同的
Thumbnail
大家應該都實際練習過機器學習的四大技術了,包含迴歸分析、分類分析、分群分析以及時間序列分析。 在機器學習模型的開發過程中,我們常將焦點放在演算法的選擇與模型的訓練上,但實際上,一個高效且穩健的模型,往往取決於資料的前處理與特徵的設計。隨著模型複雜度提升,過擬合、特徵尺度不一致以及高維資料噪聲等問題會
Thumbnail
在現實生活中,許多資料並非靜止的,它們會隨著時間不斷變化,形成了一種特殊的資料型態,這就是時間序列資料。時間序列數據廣泛存在於各種領域,如金融市場的股票價格波動、氣候監測的溫度變化、製造業的機器故障檢測,以及網站流量的每日訪問量等。這些資料的最大特點在於:當前的觀測值與過去的值密切相關,未來的趨勢也
Thumbnail
BYROW 函數是 Excel 中用來「逐列套用公式」的動態陣列工具。它能針對每一列資料執行指定的運算邏輯,並回傳一組結果,適合用在列向統計、資料彙整、自動化報表等場景。本文將說明 BYROW 函數的語法、應用範例、注意事項與進階技巧,幫助你在資料處理與公式設計中更靈活地操作列向資料。
Thumbnail
VLOOKUP 函數是 Excel 中用來在表格中「垂直查詢」資料的經典工具。它能根據指定的查詢值,在第一欄中尋找對應項目,並回傳同列中其他欄位的資料,適合用在成績查詢、產品比對、報表擷取等場景。本文將說明 VLOOKUP 函數的語法、應用範例、注意事項與進階技巧,幫助你在資料處理與查詢分析中更有效
Thumbnail
疾病診斷在醫學領域中是一項非常重要的任務,正確的診斷能夠有效幫助患者及早接受治療,改善預後,並避免不必要的風險。然而,疾病診斷通常需要依賴大量且複雜的數據分析,例如病患的檢測數值、影像和臨床數據等。面對如此大量的資料,人工診斷可能會因主觀判斷或疲勞而存在不確定性,這便為機器學習和人工智慧提供了一個巨
Thumbnail
在學習完機器學習的各種基礎知識後,我們終於可以開始進入實際應用的階段。機器學習的常見應用大致可分為四大類:迴歸(Regression)、分類(Classification)、分群(Clustering)、以及時間序列分析(Time Series Analysis)。身為資料科學家,理解並掌握這些方法
Thumbnail
這篇筆記主要是介紹資料科學家的好朋友:迭代器和生成器! 迭代器與生成器是大家在處理資料以及訓練模型時常常會使用到的工具,請務必熟悉他們的用法!!!
Thumbnail
大部分在學習程式語言的人很常會看到或是聽到一個很抽象的詞:物件導向 對於初學者來說,又出現了一個很難以理解的名詞,而且在學習上的確也是很常讓人碰壁的一部分。雖然有著不小的學習障礙,但是對於提升程式設計能力有很大的幫助,因此建議大家可以多點耐心去接觸並且練習如何使用它。
Thumbnail
學習到這個階段,大家如果都有跟上的話已經可以試著自行開發一些工具或是演算法了。不過Python還有提供許多進階的功能可以幫助我們在開發的過程中更順暢、更有效率。 ⚠️ 例外處理 (Exception)
Thumbnail