合成數據

【如何讓研究自傳更具吸引力：從招聘人的視角提升碩博士生的研究習慣】

2024/11/06

在碩博士的求學旅程中，一份好的研究自傳不僅是求職或申請研究機會時的「敲門磚」，更是訓練清晰表達研究價值的一次練習。最近參與中研院統計所的暑期實習生招聘，我發現許多申請人自傳中的常見錯誤，其實反映出日常研究中缺乏的幾項關鍵習慣。在此，我將分享三個常見錯誤，以及相對應的改進步驟，希望能對碩博士生

作為一名研究員，我時常面對需要構思的挑戰。構思，正如和菜頭老師在《成年人修煉手冊》中所描述，是一種深思熟慮的想像力運用。而且，構思不僅依賴靈感，它還需要訓練和方法的支持。這篇文章將分享我如何透過兩種珍貴的靈感，進行有效的構思，並將它們應用於我的研究工作中。 ▋構思：理順與未知的靈感

#構思 #有效構思 #靈感

N001｜【AI 訓練陷阱：AI 訓練數據品質下降的危機】── 1. 模型崩潰 2. 資料來源的重要性3. 多樣性和代表

2024/07/28

N001｜【AI 訓練陷阱：AI 訓練數據品質下降的危機】 ── 1. 模型崩潰（Model Collapse） 2. 資料來源的重要性（Importance of Data Source） 3. 多樣性和代表性（Diversity and Representativeness）4. 保持數據品質

「構思，動詞，指運用心思，常指寫文章或創作藝術前所用的思考。」「構思其實是一種想像力，在事情尚未發生之前，先想像出它完成後的模樣。覺得這模樣還不錯，修修補補，加以完善，然後動手實際操作。」「有兩種靈感值得珍藏。一種事你明顯感覺到可以跟著他順流而下，把所有關節都打通。另

#構思 #學習 #研究所

GM 003｜REaLTabFormer的父表模型和子表模型如何運作？

2024/07/05

REaLTabFormer 介紹了「父表模型 Parent table model」以及「子表模型 Child table model」。父表模型建模「無關聯表格數據 Non-Relational Table Data」，子表模型則捕捉「關聯表格數據 Relational Table Data」。

#多表格生成 #合成數據 #關聯數據庫

【3個在TECHSPO Los Angeles 2024的重大收穫】

2024/06/05

如果你是科技領域的專業人士，這篇文章會對你有幫助。它將分享我在TECHSPO Los Angeles 2024中得到的三個重要收穫。這次活動讓我深刻體會到合成數據的未來潛力以及如何應用於商業。 ▋收穫1 - 資料無塵室的潛力在這次活動中，我遇見了日本資料

#合成數據

回顧2023年UCLA統計與資料科學系博士後的所見所聞

2023/12/24

今年2023年，我經歷了許多重要的事情。首先，在臉書的一個組裡進行研究合作，這是一個重要的開始。隨後，我參加了ICORPS計畫，進行了顧客發現的工作。在研究方面，我與其他博士後研究人員合作，並指導了多名碩士生完成他們的論文。此外，我還帶領暑期研究實習生進行了基本的計算和研究工作。

#UCLA #博士後 #美國

頁央

2023/12/24

期待之後的分享👍👍😂

【撰寫學術Newsletter，打造豐富合成數據專欄的3個策略】

2023/06/05

2023年5月，我在UCLA做合成數據(Synthetic Data)的研究。我正規劃撰寫組內的學術Newsletter，讓他變成重要的知識平台，探索合成數據的各種可能性，分享研究想法。以下是目前我規劃撰寫學術Newsletter，打造豐富合成數據專欄的3個策略：

#學術工作流 #UCLA #研究所

紫式講義的沙龍

2022/08/04

我對合成數據使用的三個思考：是夥伴，是替代，還是偏誤

這篇文章與你分享，我閱讀合成數據文章以後，產生的三個思考與理解。本文章收錄三個思考：合成數據能夠成為夥伴，還是成為替代呢？我們關心的是統計任務，還是運營任務呢？基於合成數據的學習，要怎麼學得好呢？思考#1：合成數據，是夥伴，還是替代？有兩個觀點來看合成數據：夥伴，或是替代。

#合成數據