極端值

含有「極端值」共 17 篇內容
全部內容
發佈日期由新至舊
第 1 題 某房仲分析團隊整理台北市信義區過去一年的實價登錄成交價資料共 1,200 筆,其中九成落在每坪 80~160 萬元,但有 12 筆因豪宅交易達每坪 450~600 萬元。資料分析師要向房地產電視節目提供「一般民眾普遍成交水準」的參考數值。在以下敘述性統計量中,何者最能避免少數豪宅極端值
https://www.youtube.com/watch?v=K_A2x1sg_bg 一、我們被一種故事洗腦了 這幾年,我們幾乎每天都在看到同樣的敘事: 名校畢業 海外留學 進 Fortune 500 升遷順利 創業成功 自媒體爆紅 幣圈翻倍 看久了,你會產生一種錯覺: 成功是不是其實很
含 AI 應用內容
#成功#結構#人生
這篇文章幫你把零散的知識拼湊成一張完整的「大腦進化地圖」:從機器學習的三大門派(監督、非監督、強化學習)出發,深究 AI 為什麼能「自適應」學習,並剖析分類高手 SVM 如何在混亂中劃分界線。最後,我們將跨入深度學習的領域,揭開神經網路與 Transformer 的運作祕密。
Thumbnail
很多人誤以為 AI 規劃師的工作就是每天鑽研高深的演算法,但真相往往比較骨感:我們有 80% 的時間都在跟「髒資料」搏鬥。 一、 數據藍圖:先看清楚你的「礦石」長什麼樣 在動手處理前,得先搞清楚手上的資料屬於哪一類。這決定了後續要動什麼樣的手術。 結構化數據: 就像 Excel 表格或 SQL
Thumbnail
敘述性統計是資料分析的「體檢報告」,也是iPAS考試科目的絕對重點。許多考生只會看「平均數」,卻忽略了極端值可能帶來的巨大誤判。從資料的三大維度—「集中趨勢」、「離散程度」與「分佈形狀」入手,帶你徹底搞懂何時該用中位數取代平均數、為什麼計算速度要用調和平均數、以及如何利用IQR與箱形圖秒殺離群值。
Thumbnail
📋 程式概述 這是一個企業級股票數據清洗與時間週期轉換系統,專門處理日 K 線數據並轉換為週/月/年 K 線,同時進行多層次的數據品質控管與異常偵測。程式採用玩股網口徑標準,確保數據品質符合量化交易需求。 🎯 核心功能架構 1. 數據來源與處理範圍 時間範圍:2000-01-01
含 AI 應用內容
#python#資料清洗#數據
11/8考試要到了,但統計這個單元對於我們這種統計通通還給老師的人來說,真的是有夠他媽的難也,我用AI做了一個好理解的版本,分享給有需要的人,讓我們一起準備吧!! 🧠 L22 大數據處理分析與應用-數學與統計方法 課程內容分成五大主題: 描述性統計: 拿到一堆數字(資料)時,怎麼跟別人「一
對數轉換(Logarithmic Transformation)是將數據中的每個值轉換為其對數值的過程,常用於數據分析和機器學習中,以改善數據分佈、降低偏態,並使數據更接近常態分布。 對數轉換的主要目的 減少偏態(Skewness):將右偏分佈的數據拉近對稱,有利於統計模型的假設; 縮小數據範
特徵縮放的常用方法主要有以下幾種: 最小最大縮放(Min-Max Scaling) 將特徵值縮放到固定範圍(通常是0到1之間),計算公式是 。這種方法適合數據分佈較均勻或需要映射到特定範圍的場合,但對極端值敏感。 標準化(Standardization) 將特徵值的平均數轉為0,標準差轉為
Thumbnail
對「策略4.3」進行客觀的數據陳述與分析,分為「隔夜短線特徵」與「月度持有長期績效」兩部分。 一、 隔夜短線特徵分析 (樣本數:18,441筆) 此部分分析策略篩選股後,下一個交易日的日內價格表現。 最高價表現 (由開盤至盤中最高點)平均報酬率:+2.49%。報酬分佈:所有樣本的盤中最高價均高
Thumbnail