方格子 vocus

我為什麼在做英國股市週K漲幅分布前，主動排除 12% 標的？

grissom lin

發佈於資料清洗

2026/03/01 更新2026/03/01 發佈閱讀 6 分鐘

投資理財內容聲明

在建立 9 國股票週 / 月 / 年報酬分布系統時，我遇到一個現實問題：

真實市場資料並不乾淨。

以英國市場為例（Yahoo Finance 資料）：

部分股票以 pence (GBp) 記價
部分股票以 pound (GBP) 記價
某些小型股在歷史資料中出現 100x 單位翻轉

這會造成什麼？

如果不處理，週報酬可能出現：

+9,800%

-99% +4,500%

這不是市場波動，而是資料單位錯誤。

問題規模

UK universe：1559 檔

Near-100x scale residual files：189 檔（約 12%）

我沒有嘗試完美修復，而是採取：

解法（Robust 而非 Perfect）

1️⃣ File-level exclusion

凡出現多次 near-100x scale inconsistency 的標的

→ 直接排除在統計之外

理由：

分布統計關心的是整體形態
12% 的高風險小型股排除後不影響中位數與分布結構
卻能大幅降低尾部污染

2️⃣ Return clipping（Winsorization）

週報酬裁切：

[-80%, +300%]

月報酬裁切：

[-90%, +500%]

年報酬裁切：

[-95%, +2000%]

目的不是修改資料，而是：

防止單一極端值扭曲 histogram bin 計數。

結果

排除後：

UK 月報酬樣本數：77,002
年報酬樣本數：6,589
分布圖尾部平滑
中位數與分位數穩定

重點

這不是資料修復問題。

這是：

在 imperfect data 下，如何建立 robust 統計系統。

當你做跨國分布比較時，

資料治理比演算法更重要。

How to Build Robust Weekly Return Distributions from Noisy Stock Market Data

Keywords targeted:

weekly return distribution
stock return histogram
winsorizing stock returns
cross-sectional return analysis
financial data quality
UK stock data pence vs pound

Opening

When computing cross-sectional stock return distributions across multiple countries, I discovered that approximately 12% of UK small-cap stocks contain persistent unit-scale inconsistencies.

Instead of trying to perfectly repair the data, I implemented a robust exclusion and winsorization framework.

Here’s how.

Step 1: Detect Near-100x Scale Errors

Some UK stocks flip between GBp and GBP pricing in historical datasets.

This produces artificial 100x jumps.

These are detected via near-factor analysis (±25% tolerance around 100x).

Step 2: Exclude Persistent Residual Symbols

Symbols with repeated scale inconsistencies are excluded entirely.

UK:

1559 total
189 excluded (~12%)

This dramatically stabilizes histogram shape.

Step 3: Winsorize Returns

Weekly returns clipped to [-80%, +300%]

Monthly to [-90%, +500%]

This prevents tail contamination from distorting:

mean
quantiles
histogram bins

Result

77,000+ monthly return samples (UK)
Stable quantile estimates
Clean cross-market comparability

Conclusion

Perfect data cleaning is not always necessary.

Robust statistical architecture is often enough.

If you're building global return distributions, focus on:

Data governance
Tail control
Symbol-level quality screening

Before optimizing your models.

含 AI 應用內容

#英國

#市場

#英鎊

《炒股不看周月年K漲幅機率就是耍流氓》資料清洗

留言

《炒股不看周月年K漲幅機率就是耍流氓》

13會員

290內容數

普通上班族，用 AI 與 Python 將炒股量化。我的數據宣言是：《炒股不做量化，都是在耍流氓》。

《炒股不看周月年K漲幅機率就是耍流氓》的其他內容

2025/12/22

【技術補充】如何將雜訊轉為金礦？台股大數據的資料清洗（Data Cleaning）實作-2

def detect_pingpong_patterns(day_df: pd.DataFrame, price_col='收盤', threshold=0.4) -> pd.DataFrame: # ... (函式內容保持不變) ... df = day_df.so

2025/12/22

【技術補充】如何將雜訊轉為金礦？台股大數據的資料清洗（Data Cleaning）實作-2

def detect_pingpong_patterns(day_df: pd.DataFrame, price_col='收盤', threshold=0.4) -> pd.DataFrame: # ... (函式內容保持不變) ... df = day_df.so

2025/12/22

【技術補充】如何將雜訊轉為金礦？台股大數據的資料清洗（Data Cleaning）實作-1

2025/12/22

【技術補充】如何將雜訊轉為金礦？台股大數據的資料清洗（Data Cleaning）實作-1

2025/11/12

【資料清洗案例】台股 3666.TWO「六位數股價」事件與減資錯位全面修正

我在跑台股 yearK 統計時，發現一筆堪稱「驚悚」的異常：某檔股票的收盤價出現六位數（30 萬元）以上！這篇不只要解剖這筆異常，更要講清楚—— 其實，這不是孤例。任何減資、拆股、反向分割的股票，都可能出現同樣錯位。我們會一起看真實案例、驗證證據，並展示一整套能

2025/11/12

【資料清洗案例】台股 3666.TWO「六位數股價」事件與減資錯位全面修正

看更多

你可能也想看

k.S的量化投資

【深度解讀】打破百萬門檻迷思：小資族如何透過「債券孳息」打造優於定存的美元現金流？

債券投資，不只是高資產族群的遊戲在傳統的投資觀念中，海外債券（Overseas Bonds）常被貼上「高資產族群專屬」的標籤。過去動輒 1 萬甚至 10 萬美元的最低申購門檻，讓許多想尋求穩定配息的小資族望而卻步。然而，在股市波動劇烈的環境下，尋求穩定的美元現金流與被動收入成為許多投資人

#玉山證券#海外債券#債券孳息

2026/02/06

k.S的量化投資

【深度解讀】打破百萬門檻迷思：小資族如何透過「債券孳息」打造優於定存的美元現金流？

#玉山證券#海外債券#債券孳息

2026/02/06

Jorge2006的沙龍

玉山證券小額債—川普又來報明牌啦!

透過川普的近期債券交易揭露，探討債券作為資產配置中「穩定磐石」的重要性。文章分析降息對債券的潛在影響，以及股神巴菲特的操作策略。並介紹玉山證券「小額債」平臺，如何讓小資族也能低門檻參與海外債券市場，實現「低門檻、低波動、固定收益」的務實投資方式。

2026/03/13

2026/03/13

拒絕梭哈投資，建立財務餘裕｜玉山證券小額債為你打造資產穩定錨

解析「債券」如何成為資產配置中的穩定錨，提供低風險高回報的投資選項。藉由玉山證券的低門檻債券服務，投資者可輕鬆入手，平衡風險並穩定財務。

#投資#資產配置#債券投資

2026/03/13

CK On Board

拒絕梭哈投資，建立財務餘裕｜玉山證券小額債為你打造資產穩定錨

#投資#資產配置#債券投資

2026/03/13

小芝女看天下

任何人都能投資！用玉山證券小額債替自己存旅費：1,000 美元就能開始的穩健理財法

相較於波動較大的股票，債券能提供固定現金流，而玉山證券推出的小額債，更以1000 美元的低門檻，讓學生與新手也能參與全球優質企業債投資。玉山E-Trader平台即時報價、條件式篩選與清楚的交易流程等特色，大幅降低投資難度，對於希望分散風險、建立穩定現金流的人來說，玉山小額債是一個值得嘗試的理財起點。

#玉山小額債#小額債#玉山證券

2026/02/12

小芝女看天下

任何人都能投資！用玉山證券小額債替自己存旅費：1,000 美元就能開始的穩健理財法

#玉山小額債#小額債#玉山證券

2026/02/12

Ultima Markets 教育學院

英國央行決議壓軸登場，面臨兩難權衡｜Ultima Markets

Ultima Markets 英國央行利率決議成為市場焦點，英鎊靜待政策信號；美元在聯準會審慎立場下維持強勢。今日市場焦點集中在英國央行（BoE）的利率決議，這是本輪主要央行會議週期的最後一場。英國央行正面臨艱難的政策權衡：通膨依然偏高（9月年率 3.8% ），而GDP成長疲弱則加大了放鬆

#ultimamarkets#英國央行#政府停擺

2025/11/06

Ultima Markets 教育學院

英國央行決議壓軸登場，面臨兩難權衡｜Ultima Markets

#ultimamarkets#英國央行#政府停擺

2025/11/06

Mech muse 智慧新知

🚀 Rolls-Royce 小型核能野心：IPO 傳聞、英國 25 億英鎊支持，全球 SMR 市場將迎爆發？

英國Rolls-Royce公司的小型模組核反應器(SMR)計畫獲得英國政府25億英鎊的巨額投資，並傳出即將IPO的消息，為全球能源產業帶來新的變革契機。本文深入探討SMR的技術優勢、市場潛力以及潛在風險，分析此舉對英國能源政策、全球核電產業和投資市場的影響。

#SMR#小型核能#科技

2025/09/03

Mech muse 智慧新知

🚀 Rolls-Royce 小型核能野心：IPO 傳聞、英國 25 億英鎊支持，全球 SMR 市場將迎爆發？

#SMR#小型核能#科技

2025/09/03

ATFX的沙龍

通膨加劇美元弱勢後，英鎊借就業數據超越後怎麼看？

本周美國唯一重磅數據——7月CPI公佈後，重新定下了美元短線疲憊的基調，因為市場幾乎可以確認聯準會9月降息會成定局。同時，英鎊得以在非美貨幣中嶄露頭角，兌美元升至近三週高位，昨日在美國通膨溫和的同時，英國的就業市場意外帶來了驚喜。 01 英國七月就業數據英國國家統計局報告顯示，7月就業人數

#英國央行#就業數據#市場

2025/08/14

ATFX的沙龍

通膨加劇美元弱勢後，英鎊借就業數據超越後怎麼看？

#英國央行#就業數據#市場

2025/08/14

ATFX的沙龍

今晚英國央行搞不搞意外？市場不太確定但英鎊很擔心

紧随美联储决议行情之后，英國央行決議今晚登場，市場的緊張感也隨之增加，因為市場定價顯示，英國央行今晚不排除會有意外的降息舉動，截止週三，市場預計降息的押注比例略高於58%，意味著英國央行可能自2020年以來首次下調基準利率。不少分析師認為，由九人組成的貨幣政策委員會(MPC)將以5:4的比例支持降息

2024/08/01