思考 #1：資料效度，度量數據集對分析與處理的合適度

預測模型的表現怎麼評估？模型評估嚴謹程度的4個等級

模型上線前的評估的嚴謹與否，攸關上線後模型的表現。你知道模型評估需要注意哪些細節？在評估過程的嚴謹性又可以如何分級呢？一起來看看吧！

#資料分析#演算法#過度配適

2023/07/23

預測模型的表現怎麼評估？模型評估嚴謹程度的4個等級

模型上線前的評估的嚴謹與否，攸關上線後模型的表現。你知道模型評估需要注意哪些細節？在評估過程的嚴謹性又可以如何分級呢？一起來看看吧！

#資料分析#演算法#過度配適

2023/07/23

專家經驗和機器學習取得的「權重」的差異，以及可能的整合方式。

在資料科學中常可以聽到「權重」，可藉由專家經驗和機器學習取得「權重」，但他們差別是什麼？在透過演算法決定權重的想法相對盛行的現今，又如何整合兩種途徑的結果？

#資料科學#資料分析#專家經驗

2023/07/02

專家經驗和機器學習取得的「權重」的差異，以及可能的整合方式。

#資料科學#資料分析#專家經驗

2023/07/02

統計急救箱的沙龍

統計急救箱─方法學的三個領域

　　在跑統計前的二三事─量化研究常見迷思當中提到了一些量化研究的常見迷思，這篇想要簡單提一下跟統計有關的方法學子領域。　　為什麼要提這個呢？因為有時候看起來像是統計的問題，其實在統計學裡面不一定能找到答案。如果不知道這類型的問題屬於哪個領域，就會連怎麼找資料都做不到。

2023/06/25

2023/06/25

在作模擬的時候，這個準不準這個問題絕對有資格被排在常見問題中的前三名。當然也是我們首先要問自己的部分。如果人家要拿這份結果去做設計評估，那他的準確性到哪? 如果不能拿來做設計參考，那我們該怎麼解讀? 而準不準的問題，要分成事前諸葛和事後諸葛兩種應用來討論。事後諸葛的類型事前諸葛的類型

2022/09/08

2022/09/08

我對合成數據使用的三個思考：是夥伴，是替代，還是偏誤

這篇文章與你分享，我閱讀合成數據文章以後，產生的三個思考與理解。本文章收錄三個思考：合成數據能夠成為夥伴，還是成為替代呢？我們關心的是統計任務，還是運營任務呢？基於合成數據的學習，要怎麼學得好呢？思考#1：合成數據，是夥伴，還是替代？有兩個觀點來看合成數據：夥伴，或是替代。

2022/08/04

我對合成數據使用的三個思考：是夥伴，是替代，還是偏誤

2022/08/04

我對合成數據本質的三個思考：可信任元素，任務導向生成模型，基準真相。

這篇文章與你分享，我閱讀合成數據文章以後，產生的三個思考與理解。

2022/08/03

我對合成數據本質的三個思考：可信任元素，任務導向生成模型，基準真相。

這篇文章與你分享，我閱讀合成數據文章以後，產生的三個思考與理解。

2022/08/03

我對合成數據的三個思考：資料效度，傾向分數，前處理的效度損失

本文章想分享給你，我在閱讀有效合成數據的文章後，產生的理解與思考。首先，本文章有三個有趣的實驗問題：資料前處理(Data-Preprocession)對合成數據效度的影響。是否需要對合成的機器學習模型調參(Tuning)。效度測量是否能預測合成數據訓練的機器學習模型的準確度。

#合成數據#機器學習#傾向分數

2022/07/30