GM 003｜REaLTabFormer的父表模型和子表模型如何運作？

王啟樺

2024/07/05 更新2024/07/05 發佈閱讀 3 分鐘

今天聊聊由 Aivin V. Solatorio[1]於2023年發表的文章，

《REaLTabFormer: Generating Realistic Relational and Tabular Data using Transformers》[2]。

REaLTabFormer的全稱是Realistic Relational and Tabular Transformer，直接翻譯就是「真實的關係與表格Transformers」。

REaLTabFormer 這個名字，我感覺就是致敬之前討論的GReaT[3]，Generation of Realistic Tabular data。

REaLTabFormer這篇文章的一個看點，

就是如何對「關係數據 Relational Data」[4] 做「生成式建模 Generative Modeling」。

關係數據在數據分析中很常見，因為許多問題常常不是一張表格就能回答，而是要整合多張表才能得到很完整的資訊。

REaLTabFormer 裡面介紹了「父表模型 Parent table model」以及「子表模型 Child table model」。

其中，父表模型專門建模「無關聯表格數據 Non-Relational Table Data」，而子表模型則是捕捉「關聯表格數據 Relational Table Data」。

而區分這兩種數據，就是要看你是不是覺得表格中的「列 Row」之間有相關性。有的話就是Relational Data，沒有的話就是Non-Relational Data。

所以，拿到一個大表格，你需要先去判斷，哪些「欄位 Columns」其數值之間是獨立的，那麼這些欄位就適合放入「父表 Parent Table」。而剩下的欄位，就可以視為「子表 Child Table」。

而父表中的每個「觀察 Observation」，會被看作是一個「序列 Sequence」，然後用「自回歸模型 Autoregressive Model」[5]去學習這個序列成員之間的條件分佈，如此就能生成父表中的「觀察 Observation」。

而子表中，由於「列 Row」之間有相關性，所以子表的一個單位，可以想成是「一串觀察 Sequence of Observations」。而要生成子表的單位，會把父表當作是給定的條件，然後使用Seq2Seq模型[6]的解碼器來生成。

如此，基本上父表格會用自回歸模型做建模，子表格會把父表格的資訊結合進Seq2Seq模型做建模，這樣就能生成關聯式數據了。

REaLTabFormer的這個做法，讓我們能研究「多表生成 Multi-Table Generation」這個研究主題，非常有意思。多表生成尤其在「數據協作 Data Collaboration」[7]的場景相當有潛力，是我認為非常有價值的研究主題之一。

Reference

[1] https://www.worldbank.org/en/about/people/a/aivin-vicquierra-solatorio

[2] https://arxiv.org/abs/2302.02041

[3] [[GM 001｜語言模型真的能生成真實的表格數據嗎？]]

[4] https://r4ds.had.co.nz/relational-data.html

[5] https://en.wikipedia.org/wiki/Autoregressive_model

[6] https://en.wikipedia.org/wiki/Seq2seq

[7] https://www.linkedin.com/in/chi-hua-wang-82ba5ab2/

留言

王啟樺的沙龍

648會員

2.0K內容數

Outline as Content

王啟樺的沙龍的其他內容

2025/03/29

【碩博士生必學閱讀思維：從 Passive Consumption 到 Active Reading】

Passive Consumption（被動接收） vs. Active Reading（主動閱讀）｜真正讓你進化的閱讀差在這裡碩博士生每天都在讀論文、讀報告、讀教材，但大多數人其實只是「看過了」，不是「讀進去了」。讀很多卻吸收很少，記不起重點、寫不出心得，不是你不夠努力，而是你還停

2025/03/29

【碩博士生必學閱讀思維：從 Passive Consumption 到 Active Reading】

2025/03/27

【碩博士生必學：用 Obsidian 打造從閱讀到寫作的知識工作流，解決資料亂、想法卡、寫不出的問題】

2025/03/27

【碩博士生必學：用 Obsidian 打造從閱讀到寫作的知識工作流，解決資料亂、想法卡、寫不出的問題】

2025/01/29

中國 AI 這麼猛？美國的領先地位真的岌岌可危嗎？

4 個關鍵洞見 + 讓你看懂中美 AI 競爭 + 若不讀，你就可能錯失整個時代的最大機遇 AI 的發展速度，真的快到讓人心驚。我們常常以為美國在 AI 領域穩居頂尖，可現在中國的 AI 創新力好像開始迎頭趕上，這背後的原因是什麼？若我們沒有跟上這波 AI 變革，就可能被遠遠拋在後面，錯失技

2025/01/29

中國 AI 這麼猛？美國的領先地位真的岌岌可危嗎？

看更多

你可能也想看

效率基地

EXCEL儀表板 | 人力資訊分析儀表板 #5 | 上手等級:入門

#EXCEL#儀表板#人力資訊分析

2024/07/03

效率基地

EXCEL儀表板 | 人力資訊分析儀表板 #5 | 上手等級:入門

#EXCEL#儀表板#人力資訊分析

2024/07/03

黃郁書的沙龍

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》，由臺灣劇團「晃晃跨幅町」製作，本文將以從舞台符號、聲音與表演調度切入，討論海妲・蓋柏樂在父權社會結構下的困境，並結合榮格心理學與馮．法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析，理解女人何以走向精神性的操控、毀滅與死亡。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

黃郁書的沙龍

《海妲．蓋柏樂》：女性困境與「永恆少年」的毀滅衝動

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

這是一場修復文化與重建精神的儀式，觀眾不需要完全看懂《遊林驚夢：巧遇Hagay》，但你能感受心與土地團聚的渴望，也不急著在此處釐清或定義什麼，但你的在場感受，就是一條線索，關於如何找著自己的路徑、自己的聲音。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

效率基地

EXCEL儀表板 | 人力資訊分析儀表板 #2 | 上手等級:入門

🎗️本次主題成果展示:人力資訊分析上集回顧 🔗EXCEL儀表板 | 人力資訊分析儀表板 #1 | 上手等級:入門🔗 ♐人力資訊儀表板分集本次人力資訊儀錶板預計分成5集依循漸進逐步完成資料整理與人力資訊取得區域樞紐分析+環圈圖 (本集教學) 性別樞紐分析+圖像

#儀表板#EXCEL#效率職人

2024/06/06

效率基地

EXCEL儀表板 | 人力資訊分析儀表板 #2 | 上手等級:入門

#儀表板#EXCEL#效率職人

2024/06/06

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

《轉轉生》（Re:INCARNATION）為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，結合拉各斯街頭節奏、Afrobeat／Afrobeats、以及約魯巴宇宙觀的非線性時間，建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發，解析其去殖民的身體政治。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

奧莉薇走在成為後端工程師之路上

SQL - 資料表 (Table)

※ 關聯式資料庫（RDBMS）是什麼？關聯式資料庫（RDBMS）是一種傳統的資料庫系統，以結構化查詢語言（SQL）為基礎，將資料儲存於預定義的表格中。這些表格包括行和列，彼此之間存在明確的關聯性。 ※ 關聯式資料庫（RDBMS）有兩個重要元素：關聯(Relational)：關聯式資料庫

2024/07/24

奧莉薇走在成為後端工程師之路上

SQL - 資料表 (Table)

2024/07/24

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11