反轉錄病毒,是一類會將自身 RNA 基因組反轉錄成 DNA 的病毒,它們會將反轉錄的 DNA 嵌入到宿主細胞基因組中,然後藉由宿主細胞轉錄轉譯出病毒的 RNA 與蛋白質,以此組裝出新的病毒顆粒達成增殖目的。
反轉錄病毒基因組的兩端各擁有長末端重複序列(long terminal repeat,LTR),藉由病毒的整合酶(integrase)將病毒基因組嵌入細胞的基因組裡,一旦嵌入就不會再離開,成為細胞基因組的一部分。
如果反轉錄病毒感染了生殖細胞,並嵌入到細胞的基因組,就會遺傳給後代,之後留在細胞基因組的病毒 DNA 就會被稱為內源性反轉錄病毒(endogenous retrovirus),簡稱 ERV。接收到 ERV 的子代,在大多情況下 ERV 已經失去生產病毒的能力,僅部分病毒基因或調控元件還保有功能。甚至經過多代後歷經細胞的 DNA 重組、ERV 刪除機制等情況,最後會剩下不完整的 ERV。因為許多反轉錄病毒僅感染脊椎動物,所以 ERV 在脊椎動物的演化中佔據著一定的重要性,在某些時候其對物種演化有利,比如之後成為脊椎動物基因組中重要的基因調控元件;但有的時候卻被認為與某些嚴重疾病有關,像是存在於人類基因組中的人類內源性反轉錄病毒 K(HERV-K),其包膜醣蛋白基因還具有活性,能生產出該病毒蛋白質,被認為會導致人類神經退化,可能與肌萎縮性側索硬化症(漸凍人症)有關。
宿主細胞其實也具有刪除 ERV 的機制,比如利用同源重組(homologous recombination)的 DNA 修復方式,針對 ERV 的 LTR 進行非同源的同源重組(unequal homologous recombination),但這機制是透過兩端的 LTR 配對進行刪除,因此最後會剩一個 LTR 還留在上面,被稱作 solo-LTR。這代表了 ERV 在脊椎動物基因組中以多種狀態下存在,有完整的、不完整的,也有只剩下 solo-LTR 的。
ERV 在不同的動物類群中分布不一,而鳥類是一個特別值得注意的群體,因為相較於哺乳類與爬行類,牠們的基因組中 ERV 比例明顯較低,這一特徵也讓鳥類在基因組結構與演化適應上有著獨特的模式。
在 2024 年的一項研究中,研究團隊選取了 405 種具代表性的羊膜動物,分析其基因組內的 ERV,其中包含 362 種鳥類、23 種爬行類與 20 種哺乳類,該項研究的目的在於了解 ERV 於鳥類演化中所產生的影響。
在分析中,團隊發現所有鳥類類群的 ERV 佔整體鳥類基因組中的比例,皆低於其他羊膜動物類群,與此同時鳥類還保有著更高的 solo-LTR 形成率,這說明鳥類在清除 ERV 的效率上高於其他類群。
ERV 可以根據來自不同種反轉錄病毒,再細分多種類別,比如 ERVK、ERVL、ERVW、ERV1 等等。研究團隊藉此分析了各類 ERV 的 solo-LTR 在鳥類基因組中的分佈,其中雀形目(Passeriformes)呈現出與其他鳥類不一樣的情況。
雀形目最早的化石紀錄大約在 5,200 萬年前,推測的起源時間在約 6,000 萬年前,擁有至少 6,500 個物種,佔鳥類物種的 60% 以上,可以說是鳥類中最大的家族,因為其普遍擅長鳴唱,所以又被統稱為鳴禽。
研究結果指出,其他鳥類的 ERV solo-LTR 都維持多樣性,但唯獨雀形目的 ERVK solo-LTR 累積比例明顯較高(ERVK 被認為是 β 反轉錄病毒,Betaretrovirus,基因組內嵌所遺留下的序列)。越接近現代分化出的類群,擁有越多的 ERVK solo-LTR,尤其是推測約在 2,240 萬年前新分化出來的雀下目(Passerida)有著最多的 ERVK solo-LTR。這些雀形目各類群分化節點與 ERVK solo-LTR 的累積呈現明顯正相關,也就顯示了雀形目的物種分化伴隨著 ERVK solo-LTR 的累積。
為了更深入理解 ERVK solo-LTR 在雀形目中的功能意涵,研究者以斑胸草雀(Taeniopygia guttata)作為代表物種,觀察 ERVK 的基因表達與功能。發現斑胸草雀體內有多達 120 個未被刪除的 ERVK 仍具有轉錄的活性,尤其在卵巢、睪丸與原始生殖細胞中的表達量顯著高於其他組織,且在生殖器官中 ERVK 的基因表達量比其他 ERV 還高。這現象代表 ERVK 在生殖器官中持續活躍,轉錄出來的 ERVK RNA 還會再次反轉錄成 DNA 嵌入細胞基因組的其他位置,由此不斷擴增。隨後經由刪除的機制,不斷累積 solo-LTR 在雀形目的基因組中。
研究者進一步比較了斑胸草雀與雞(雞形目,Galliformes)的同源基因表達量,發現有 20 個鳥類基因在斑胸草雀中序列附近帶有 ERVK solo-LTR(雞的這 20 個基因則沒有),而且表達量顯著不同。與雞相比,斑胸草雀其中有 9 個基因表達量較高,11 個基因表達量較低。 其中一個特別重要的是 ITGA2 基因。這個基因在斑胸草雀的大腦內掌管鳴叫複雜度的特定區域的表達量明顯高於雞。就在這個基因的上游區域發現了一段 ERVK solo-LTR 的序列,並發現到這個 ERVK solo-LTR 能提高 ITGA2 的表達量,這或許代表 ERVK solo-LTR 出現在 ITGA2 基因能夠促進雀形目鳴叫學習的演化。
另外雀形目的基因組在古近紀至新近紀的這段時間開始大量出現 ERVK 時,包含靈長類、齧齒類等在內的多個動物類群也紛紛出現 ERVK 的增加,只不過 ERVK 在哺乳類中通常會保留接近完整的病毒序列,仍保有活性,這也往往與老化與癌症有關,說明鳥類能高效將 ERV 轉化為 solo-LTR 的防禦機制能夠有效抑制 ERV 的有害影響。時至今日,雀形目鳥類基因組中的 ERVK solo-LTR 依然持續增長。
在命運之下,ERVK solo-LTR 出現在 ITGA2 基因的上游,增強了雀形目鳥類的發聲學習能力。而雀形目向來以多樣化與發聲學習能力聞名,這些外來的病毒序列在意想不到的情況下,促使雀形目在演化歷史中產生驚人的多樣化。
圖片授權:
(作者:白稜,編:水也佑) 參考資料: Chen, G., Yu, D., Yang, Y., Li, X., Wang, X., Sun, D., Lu, Y., Ke, R., Zhang, G., Cui, J., Feng, S. (2024). Adaptive expansion of ERVK solo-LTRs is associated with Passeriformes speciation events. Nature Communications.





















