生物演化的數據化,建立演化樹的方法

閱讀時間約 6 分鐘

本篇文章可能有些脫離科普的範疇,不過文章內容可以讓大家了解演化樹是怎麼建立出來的。請細細品味~🤭🤭🤭


系統發生樹(感謝Liang L et al提供)

系統發生樹(感謝Liang L et al提供)


生物的系統發生樹(phylogenetic tree),又稱演化樹,是一種用來描述生物演化關係的圖形模型。它通過分支結構展示特定物種從共同祖先演化而來的過程。每個分支點代表一次演化分歧的發生,系統發生樹的根部代表的是所有該群物種的共同祖先,而越接近樹冠的分支則代表越後期的物種。過往的系統發生樹以生物物種間的形態、樣貌差異多寡作為參考基準,但隨著分子生物技術的發展,現代生物往往利用基因的DNA序列作為演化親緣關係的主要參考資料。由於古生物保留至今的線索多以化石形式呈現,因此古生物的系統發生樹則依舊以生物形態、樣貌來建立,並利用最大簡約法(maximum parsimony)找到最可能的系統發生樹。


DNA序列要如何建立系統發生樹?

要建立一群物種的演化關係,代表這群物種之間一定有某些共同的特點,而且這個特點在不同物種間都存在些微差異,就是藉由這個差異的多寡來認定牠們的親緣關係。

以一個假想基因A為例,不同物種間的基因A的DNA序列差異如下:

物種1: CAGTCGATGTCGTAGTGCTA

物種2: CAGGCGTTGTCGTAGTGGTA

物種3: CAGGCGTTGTCATAGTGGTA

接著我們將這三個物種兩兩做比較,數出不同的位點數量:

物種1與物種2: 不同的位點為第4, 7, 18 ⇒ 3個

物種1與物種3: 不同的位點為第4, 7, 12, 18 ⇒ 4個

物種2與物種3: 不同的位點為第12 ⇒ 1個

之後將其作為資料矩陣:

raw-image

從資料矩陣來看,我們可以得知物種2與物種3的關係較相近,牠們有三個位點是與物種1不同的(第4、7、18位點),而物種3隨後又在第12個位點突變成A,依照這樣的關聯性建立系統發生樹。

raw-image

以真實的基因為例,肌動蛋白(actin)的基因能在酵母菌、植物、動物身上找到,是一個這些生物的共同祖先就已存在的基因。肌動蛋白基因的DNA序列在不同物種上都會有些許差異,而且我們「通常」能推測酵母菌的肌動蛋白DNA序列會比起鳥類和哺乳類物種間的肌動蛋白DNA序列差距更大。另外再以胰島素(insulin)為例,胰島素的基因是動物出現之後才演化出來的基因,因此酵母菌與植物沒有這個基因存在。在不同動物間的胰島素基因序列也存在許多差異。

以下我就用家麻雀(Passer domesticus)、人類(Homo sapiens)、家犬(Canis lupus familiaris)、家貓(Felis catus)這四種物種的胰島素基因序列做比對,從中可觀察出序列之間的差異性。

raw-image


因真實的基因序列要比之前的假想基因A還要長且其變異較複雜,有些基因甚至比胰島素基因還要長好幾倍,光靠人力計算這些物種的關係是毫無效率的,所以科學家有發展一套演算法,並藉由電腦程式分析其序列差異的多寡畫出基因系統發生樹。

以下便是胰島素基因序列比對後出來的結果:

raw-image

這邊我們可以看見胰島素基因的系統發生樹與物種的親緣關係是相對應的,家犬與家貓同為食肉目,在親緣關係四個之中最近,接著貓狗與人都是哺乳類,而關係最遠的則是家麻雀。

當我們要將一群不同物種判定親緣關係絕對不會只使用一個基因作為標準,因為有些基因可能會出現物種親緣關係雖遠但剛好該基因的序列差異卻相近的情況出現,甚至比物種親緣近的序列還要近。這個情況很常見,參考下圖,以假想基因H為例子,當共同祖先的族群中某些個體攜帶H0的基因,而另外一些個體則帶的是H1的基因(H0和H1是同一個基因,只是DNA序列上出現些微差異)。當C物種先演化出來時,族群裡只保留了H1基因,攜帶H0的個體隨後全消失了。另一邊A與B物種的共同祖先在當時族群中還留有H0和H1的個體,但之後演化成A與B不同物種時,A族群保留了H0,B族群保留了H1。在此我們如果從H基因來比較A、B、C三個物種的親緣關係時,會發現B與C都是H1,就會誤認為B與C的關係比較近,但事實上A與B的關係才是最近的,單純依照H基因作比對的結果會與真正演化的情形相違背。

就真實例子而言,我們都知道人類與黑猩猩的關係是最近的,但人類約30%的基因組卻與大猩猩最近,如果只參考該30%就會誤認為人與大猩猩的關係更近。這問題稱作不完全譜系分類(incomplete lineage sorting),也就是特定基因做出來的系統發生樹與真實物種系統發生樹出現不一致。故在製作物種系統發生樹時都必須要考慮好這些問題,才能建立好貼近演化事實的系統發生樹。為了避免出現不完全譜系分類的情況,生物資訊方面建立了不同的方法降低其出現的機會,知名的演算法例如ASTRAL、StarBEAST2、MP-EST等等,並配合物種的全基因組定序(whole genome sequencing)與全外顯子定序(whole exome sequencing)等等的比對,才能更完善和更精準地選擇最可能的物種親緣關係譜系。


古生物如何建立系統發生樹?

古生物學家會觀察化石上生物的整體樣貌、骨骼結構、軟組織特徵、遺留分子的化學特性等等線索來分析該物種的歸類。他們如果要將同類群的不同古生物物種進行比對時,會選取各個不同部位做差異的判斷,並將這些差異數據化,比如有該項特徵時為1,沒有該特徵為0,抑或者某特徵如果是三角形為0,圓形為1,都不是則為2。最後再將這些數值統整建立出系統發生樹。

以下我提供一個假想的簡單例子:

有該特徵為1,沒有該特徵為0

(特徵1)鼻骨中央橫向擴張,覆蓋眶前孔背外側:恐龍A(0)、恐龍B(1)、恐龍C(1)

(特徵2)頂骨後方突起越過上枕骨:恐龍A(1)、恐龍B(1)、恐龍C(1)

(特徵3)肩胛骨於外側視角明顯接近頸部:恐龍A(1)、恐龍B(0)、恐龍C(0)

之後將其作為資料矩陣:

raw-image

我們可以看出依據這三個特徵,恐龍B和恐龍C的物種親緣會最近,就能藉此畫出系統發生樹。

raw-image

當然在真實分析古生物親緣關係時會參考數十種至數百種特徵,再藉由軟體分析所有資料矩陣才能讓結果呈現更有可信度的系統發生樹。趨同演化有時也會誤導形態上的親緣辨認,比如鯊魚的尾巴和魚龍的尾巴形態相似,但事實上鯊魚屬於軟骨魚綱,而魚龍屬於爬蟲綱,關係十分遠。因此比對越多的參考資訊越能夠降低誤判的發生。

系統發生樹是我們理解地球上各種生物之間複雜關聯的關鍵工具。它不僅揭示了生物如何隨著時間演化,還幫助我們追溯共同祖先的足跡,進一步理解物種多樣性背後的歷史和機制。隨著分子生物學技術的進步,系統發育樹的準確性和細緻度不斷提升,讓我們能更全面地探索生命的演化奧秘。

作者:水也佑

你對古生物了解多少呢?在進入這個領域之前這裡提供古生物學的基本認知~
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
早在19世紀末,科學家就開始探索前寒武紀(寒武紀以前)生命的存在,首次埃迪卡拉紀的化石描述也可追溯到那個時期,但當時的發現並未引起廣泛關注,許多古生物學家不願接受前寒武紀存在大型
在動物的演化史中,寒武紀大爆發堪稱其中最重要、最引人入勝的時期。大爆發的發現源於早期對地層化石的研究,當時人們驚訝地發現,寒武紀地層中突然出現了大量豐富多樣的動物群化石,與前一時期的地層相比,這是一個極其戲劇性的轉變,也展開了顯生宙時代。早在18世紀,古生物學家威廉·布克蘭就曾談論過這一現象,連
最近正好看到一些關於學名更動的事件,所以就想到我們好像還沒談過關於學名使用的一些情況,所以這次就來稍微說明一下吧,說不定以後會提到。(也有可能不會) 首先是基本觀念(忘記之前入門文章有沒有講過,這邊再提一次)學名只能是拉丁文,沒有所謂的中文學名,所有中文名稱都是俗名,另外自屬以下階級的學名書寫上要
古生物學的主要研究對象多以恐龍為主,其骨骼結構也是化石的重要研究對象。因此我對獸腳亞目恐龍的顱骨做了粗淺的整理。大家大致認識牠們的顱骨結構後,往後提到哪種骨骼,也比較容易吸收相關的資訊。
在人類歷史的大部分時間,區分生物的方式往往是使用特徵來區分,比如有翅膀的歸一類,有鰭的歸一類,這種區分方法可以快速的依照不同生物的表徵進行分類,很有效率。 但隨著近百年來演化學的蓬勃發展,科學家們發現這種傳統的分類方法存在明顯的問題。 演化這個概念出現之後,每個物種之間親近與否不再是看外表來決定
痕跡化石(Trace fossil) 痕跡化石保留了過去生物活動過的痕跡,例如腳印、抓痕、咬痕、覓食的痕跡、巢穴、糞便等。痕跡化石大部分不容易被察覺,早期有很多條狀的痕跡化石一度被誤認為是海草或某種蠕蟲的化石,有不少恐龍足跡也被當作是由某種大鳥所留下。現代的痕跡化石研究主要是德國考古學家阿道夫·塞
早在19世紀末,科學家就開始探索前寒武紀(寒武紀以前)生命的存在,首次埃迪卡拉紀的化石描述也可追溯到那個時期,但當時的發現並未引起廣泛關注,許多古生物學家不願接受前寒武紀存在大型
在動物的演化史中,寒武紀大爆發堪稱其中最重要、最引人入勝的時期。大爆發的發現源於早期對地層化石的研究,當時人們驚訝地發現,寒武紀地層中突然出現了大量豐富多樣的動物群化石,與前一時期的地層相比,這是一個極其戲劇性的轉變,也展開了顯生宙時代。早在18世紀,古生物學家威廉·布克蘭就曾談論過這一現象,連
最近正好看到一些關於學名更動的事件,所以就想到我們好像還沒談過關於學名使用的一些情況,所以這次就來稍微說明一下吧,說不定以後會提到。(也有可能不會) 首先是基本觀念(忘記之前入門文章有沒有講過,這邊再提一次)學名只能是拉丁文,沒有所謂的中文學名,所有中文名稱都是俗名,另外自屬以下階級的學名書寫上要
古生物學的主要研究對象多以恐龍為主,其骨骼結構也是化石的重要研究對象。因此我對獸腳亞目恐龍的顱骨做了粗淺的整理。大家大致認識牠們的顱骨結構後,往後提到哪種骨骼,也比較容易吸收相關的資訊。
在人類歷史的大部分時間,區分生物的方式往往是使用特徵來區分,比如有翅膀的歸一類,有鰭的歸一類,這種區分方法可以快速的依照不同生物的表徵進行分類,很有效率。 但隨著近百年來演化學的蓬勃發展,科學家們發現這種傳統的分類方法存在明顯的問題。 演化這個概念出現之後,每個物種之間親近與否不再是看外表來決定
痕跡化石(Trace fossil) 痕跡化石保留了過去生物活動過的痕跡,例如腳印、抓痕、咬痕、覓食的痕跡、巢穴、糞便等。痕跡化石大部分不容易被察覺,早期有很多條狀的痕跡化石一度被誤認為是海草或某種蠕蟲的化石,有不少恐龍足跡也被當作是由某種大鳥所留下。現代的痕跡化石研究主要是德國考古學家阿道夫·塞
你可能也想看
Google News 追蹤
Thumbnail
馴化對作物本身造成的最大的影響,大概就是「馴化症候群」了,可以吃/用的部位變大、從雌雄異株變為雌雄同株、多年生/二年生變成一年生、從異株授粉變為自花授粉、可食部分變得美味... 但是,馴化還會對作物有其他的影響,而且,有些是不可逆的!
Thumbnail
隨著農業的開展,隨之而來的馴化與育種,影響了植物與它的好伙伴-微生物體-的互動。這使得植物需要更多肥料、需要更多農藥。 如果可以讓植物能喚回它的好伙伴,或許就不需要那麼多的肥料與農藥了?
Thumbnail
根據研究,植物大概在4.7億到4.5億年前開始登陸。在漫長而漸進的登陸過程中,植物會面對許多新的挑戰。 新的挑戰需要新的基因,而這些新的基因從何而來呢?
Thumbnail
隨著基因定序的技術越來越成熟,我們也更有辦法完成具有複雜/大基因體生物的定序,所以大家大概都曾聽說過,哪個生物的基因體是目前已知最大的,打破了之前的另外一種生物的紀錄等等。 但是,基因體大未必就一定有什麼優勢。最近的一個研究,甚至認為基因體越大壞處越多...是真的嗎?
Thumbnail
在我還沒有跨進植物這個領域之前,我對於植物只有很粗淺的了解。當時,我並不知道植物有所謂的多倍體,就更不用提異源多倍體了。 而且,因為從小就知道馬與驢交配後生出來的騾並不具有生殖能力(後來知道有極少數有),所以一直認為生物就是不能異種交配。卻沒想到,植物有很多多倍體!
Thumbnail
不明生物,此刻就在某處... 產生「異變」!? (雖然不清楚那是什麼狀態)? 可能是「進食」,也可能是「進化」。 無論是哪一種... (似乎都在預示著危險即將到來)...
Thumbnail
同性性行為一直是很多學科領域所關注的重點,這其中包含了心理學、社會學、生物學和演化學等。由於同性性行為無法繁衍後代,這在理論上而言是不利於演化的,但這樣的行為卻一直存在於大量動物物種之中,因此也一直有人認為這是演化論的悖論。 目前全世界有約1500多個物種被觀測到擁有同性性行為,這其中包含昆蟲、
Thumbnail
人生有沒有所謂的劇本呢? 我們的人生是自己打造出來的,還是被套用出來的? 蜜蜂採蜜、構築蜂巢。 螞蟻扛糧、挖建蟻穴。 小昆蟲的蟲生軌跡寫在基因裡,生存、繁衍、禦敵…… 我們的基因裡也寫著訊息,是否也帶著我們的生命軌跡? 或者說……劇本。
Thumbnail
外來種、歸化種、入侵種區別。外來入侵種對人類及生態的危害大解析與說明等等。
Thumbnail
多細胞生物的細胞之間可以透過細胞連接(intercellular connections)或原生質絲(plasmodesmata)來互相聯絡、互通有無,單細胞的藍綠菌(cyanobacteria)會嗎?最近的研究發現,給了肯定的答案!
Thumbnail
馴化對作物本身造成的最大的影響,大概就是「馴化症候群」了,可以吃/用的部位變大、從雌雄異株變為雌雄同株、多年生/二年生變成一年生、從異株授粉變為自花授粉、可食部分變得美味... 但是,馴化還會對作物有其他的影響,而且,有些是不可逆的!
Thumbnail
隨著農業的開展,隨之而來的馴化與育種,影響了植物與它的好伙伴-微生物體-的互動。這使得植物需要更多肥料、需要更多農藥。 如果可以讓植物能喚回它的好伙伴,或許就不需要那麼多的肥料與農藥了?
Thumbnail
根據研究,植物大概在4.7億到4.5億年前開始登陸。在漫長而漸進的登陸過程中,植物會面對許多新的挑戰。 新的挑戰需要新的基因,而這些新的基因從何而來呢?
Thumbnail
隨著基因定序的技術越來越成熟,我們也更有辦法完成具有複雜/大基因體生物的定序,所以大家大概都曾聽說過,哪個生物的基因體是目前已知最大的,打破了之前的另外一種生物的紀錄等等。 但是,基因體大未必就一定有什麼優勢。最近的一個研究,甚至認為基因體越大壞處越多...是真的嗎?
Thumbnail
在我還沒有跨進植物這個領域之前,我對於植物只有很粗淺的了解。當時,我並不知道植物有所謂的多倍體,就更不用提異源多倍體了。 而且,因為從小就知道馬與驢交配後生出來的騾並不具有生殖能力(後來知道有極少數有),所以一直認為生物就是不能異種交配。卻沒想到,植物有很多多倍體!
Thumbnail
不明生物,此刻就在某處... 產生「異變」!? (雖然不清楚那是什麼狀態)? 可能是「進食」,也可能是「進化」。 無論是哪一種... (似乎都在預示著危險即將到來)...
Thumbnail
同性性行為一直是很多學科領域所關注的重點,這其中包含了心理學、社會學、生物學和演化學等。由於同性性行為無法繁衍後代,這在理論上而言是不利於演化的,但這樣的行為卻一直存在於大量動物物種之中,因此也一直有人認為這是演化論的悖論。 目前全世界有約1500多個物種被觀測到擁有同性性行為,這其中包含昆蟲、
Thumbnail
人生有沒有所謂的劇本呢? 我們的人生是自己打造出來的,還是被套用出來的? 蜜蜂採蜜、構築蜂巢。 螞蟻扛糧、挖建蟻穴。 小昆蟲的蟲生軌跡寫在基因裡,生存、繁衍、禦敵…… 我們的基因裡也寫著訊息,是否也帶著我們的生命軌跡? 或者說……劇本。
Thumbnail
外來種、歸化種、入侵種區別。外來入侵種對人類及生態的危害大解析與說明等等。
Thumbnail
多細胞生物的細胞之間可以透過細胞連接(intercellular connections)或原生質絲(plasmodesmata)來互相聯絡、互通有無,單細胞的藍綠菌(cyanobacteria)會嗎?最近的研究發現,給了肯定的答案!