在這個資料滿天飛,人人都曉得要拿證據才能說話的年代,資料變得到處可見,尤其是這一兩年,地球爆發世紀瘟疫,Covid-19的病毒在全球各處襲擊所有人類的健康。在防疫為首要的時刻,無論是病毒學家、公衛專家、醫療照護學者、政府部門、甚至各方公民,若欲表達意見,都被期待要拿出數據為其論述添加說服力。在生命科學或生醫科學的研究機構裡,資料的地位就更不用說了,提出量化或質性的資料,幾乎所有專家表達意見的起手式。
生物學家幾乎天天進實驗室做實驗產生資料,並把資料排列、整理好,為某段宣稱提供支持做為證據,然後在研討室裡與跟同行分享,一起討論,此時同行可能會有兩個反應,一個是了解後表示肯定,另一個是提出疑問或質疑,接著,生物學家將資料帶回去進行修改或重做實驗,將資料調整後,置入論文適合段落,投稿期刊。
此過程中,生物學家陳述發現需要資料,表達了解、質疑、反駁也需要資料,事實上,社群內部對一份資料是否成為某宣稱的證據,會進行繁複與反覆的解釋與辯駁,這過程相當複雜,因為涉及論文撰寫者與審查人個別背景信念、對資料的認知、與推理過程的差異與彼此說服(楊倍昌,2016)①。因此,在生物學的領域裡,資料佔有相當重要的地位。今天,我們就試著從科學哲學的角度來看:生物學實驗中的資料。
我們從里昂內莉(Sabina Leonelli)2016年出版的《以資料為中心的生物學:哲學研究》(Data-Centric Biology: A Philosophy Study)此書談起。里昂內莉是一名科學哲學家,她順應最近三十年科學哲學進入重視科學實作的「實作轉向」(practice turn),對當今以資料或數據為主角的生物學實作與未來發展進入深入且完整的探討。深入是指,她延續傳統科學哲學對觀察與理論,以及資料與模型的討論,延伸至今日大量仰賴數位與線上數據庫的生物學實作,對「資料」給出新的刻畫。完整是指,她把對資料的哲學討論,擴張到相關的科技政策與科技與社會學(STS)討論。全書層次很多,廣度也夠,但為切合我們這裡的討論旨趣,我們僅選擇與生物學實驗資料有關的部分進行介紹 ②。
真正開始介紹前,我們有必要對相關的哲學背景交代一下。里昂內莉把自己選取的思路取向稱為「以資料為核心的進路」(a data-centric approsch),原因是,她從現代生物學實作的觀察中,理解現代生物學家是如何由資料來驅動研究發展、如何將實驗結果視覺化後將其轉換為具有證據效力的證據。
這個進路對比傳統以「以理論為核心的進路」(a theory-centric approsch),傳統科哲家習慣把資料視為檢驗理論的工具,如波普曾說「理論家才是真正指引實驗的人,實驗家並非完全投注於精確的觀察,他的工作大部分是屬於理論的,從最初的設計到實驗室裡的完工,理論一直主宰着實驗的研究」(Popper 1959: 107)。他們認為,科學家做實驗產生資料是為了服務理論,有此觀點的其中一個理由是,哲學家介入觀察與討論的時間點是在科學家完成資料之後,才去看資料與理論的關係如何,而且他們只看重關於觀察的語句間之形式邏輯的證成關係。然而,以資料為核心的進路不同,如里昂內莉就主張,當今的哲學研究者應該從科學家正在實驗室產生或形成資料就開始觀察或分析,去思考資料是什麼、扮演什麼角色等問題,如此才不會又落入傳統僅環繞理論一角而發展的哲學框架(Leonelli 2016: 1-2)。
其實,里昂內莉不是第一個把哲學討論主調性從理論拉到資料的哲學家,在她之前,生物學哲學曾興起一段「不要只看理論說明,還要看現象調查」的發展,這是一位一樣重視科學實作的生物學哲學家瓦特斯(C. Kenneth Waters)所提出的觀點。瓦特斯最早是從古典遺傳學的實作中,看出原來生物學家並沒有像傳統科哲那樣執著某個「中心理論」(central theory)來設計和操作實驗,在瓦特斯看來,與其繼續順著傳統科哲說生物學家是透過實驗在擴展既有理論的說明力,不如說實際上他們是透過實驗去調查那些從未見過、新看到的生物現象來推動生物學的進展。
在瓦特斯的深入分析下,生物學進展是靠理論說明和調查現象的互相交織,互為動力的方法學在進步的。他不僅用古典遺傳學的實作做論證案例,也用現代分子生物學的實驗爭論,無論是古典還是當今的實際案例,都告訴生物學哲學家應該開始鬆開傳統對理論過度偏重的影響,建議當代的哲學研究應放更多注意力在生物學家對現象調查的面向上(Waters 2004, 2008)。
持有類似精神的研究取向不只有瓦特斯,亦如我們在§2所介紹的「探索實驗」,那裡提到的生物學哲學家也都是受到生物學實作發展的影響,特別是在分子生物學中,由高通量技術所帶來的研究方法變革,如次世代基因體定序、微陣列實驗、用同位素追蹤生物體活動、以數位化分類生物標記、以及各種新式的資料分析方式,這些都巨幅地改變了生物學家做(doing)科學的方式(Franklin 2005; Burian 2007)。這其中,能牽動生物學家研究工作方向的主角不是理論、也不是定律、甚至不是機制假說,而是資料。
傳統科學哲學對資料的討論,或說得更精確些,對觀察的討論,是著重在對觀察的語句進行分析。簡單講,觀察以下幾種,一種是認為觀察是「中立於理論」,是關於這個世界純然、客觀、內容固定(因為產生的物理條件固定)的表徵(Hemple [1952]1970),另一種則認為,不可能有所謂純然客觀的表徵,因為所有的觀察總有個認知主體在觀察然後做報告,主體必定帶有某個興趣、背景假定或背景知識去做觀察,且透過語言將報告表達出來,因此,觀察必定或多或多是「背負理論」的(Hanson 1958)。還有第三種是來自哈金(Ian Hacking),他認為,實驗室中,有些「值得注意的觀察」(noteworthy observations)是以特殊的方式出現在理論之前(Hacking 1983: 155),換言之,觀察未必要依賴在特定想法或理論之上,觀察可以是一種很獨立的行為,同樣地,實驗資料也可以單純地是科學裝置所產生的一種記號(marks)而已,記號不一定要與某個理論或命題相關 ③。
我們回到生物學,當我們去看一張表現染色體上基因標記(gene marker)的圖、或一張由微陣列技術顯現的基因表現量(gene expression level)、還是一張紀錄果蠅胚胎發育的照片,以上無論是量化地呈現基因結構或基因表現樣式,還是質性地記錄生物胚胎的發育歷程,這些都是由生物學實驗資料所顯示出來的「模式」(pattern),等待生物學家對其做出解釋。
從里昂內莉的爬梳裡,長期觀察生物學實作的哲學家任柏格,他對生物實驗資料的看法與上述看法不同。他扣緊生物學實作中的一個重要核心:操控。對任柏格而言,實驗室裡的生物學家時時都在進行操控或干預,因此,資料不是哈金說的,僅僅只是科學裝置所產生的記號而已,任柏格認為,科學裝置所產生出來的只是關於生物體或其活動的「軌跡」(trace)或「信號」(signal),而軌跡或信號需要生物學家對其做進一步的操控才能成為資料,例如把它們記錄下來、儲存起來、進行排列和調整等等,這些加工的動作都是為了使「軌跡」變成為對他人有用或有意義的「資料」(Leonelli 2016: 70),否則軌跡也只是軌跡而已。
以生物學家桑格(Frederick Sanger)用DNA定序方法做出第一條DNA序列膠為例,桑格透過基因序列膠,讓噬菌體(PhiX174)的DNA分子結構被世界看見。對任柏格而言,膠上的條紋就是生物學家在實驗室裡用裝置產生的軌跡,然後他們把條紋加以抽象化,用生物學理論將其解釋為是GATC等四個核苷酸鹼基,這就是把軌跡轉換為資料的過程。
拉圖(Bruno Latour)則認為,科學實作仰賴的並非科學家的心智或認知,而是「不變的可移動之物」(“immutable mobiles”)的產生和移動,「不變的可移動之物」包括「圖像」、「記寫」功能,將不同事物與時空聚攏在一起,這涉及資料的能動性(mobility)與使用者間的複雜關係(Latour 1999)。
那麼里昂內莉呢?她想走一條新的路。她爭論,資料不是獨立人類心靈之外的東西,也沒有固定的科學價值,她願意在有限的程度上,承認人的認知對資料判定的影響,但是否理論背負不是她的重點,她的重點在於資料在科學實驗活動中形成的過程,也就是她所謂的「打包」。對現代生物學家而言,產生資料或許已不是一件特別難或需要討論的事,真正需要討論的是「打包的策略」(data packaging strategies)。因為在實作中,資料總是為了說服某個對象而存在。資料自實驗室產生後,會被操控,然後被傳遞,置入論文中,上傳至線上資料庫,再由其他生物學家所用,形成另一筆資料。
無論是資料打包還是傳遞,生物學家總是需要時時去思考:這資料是要用做什麼?或要從資料看什麼?在不同的研究階段,資料需要被賦予不同的證據價值,因此,生物學實驗中的資料,沒有固定形式,也沒有固定內涵,要看生物學家使用資料的目的、脈絡、條件,去規劃不同的實驗產策略。
② Leonelli, Sabina (2016). Data-Centric Biology: A Philosophy Study. Chicago: The University of Chicago Press.
③ 關於傳統科學哲學對觀察與理論關係的詳細討論,可見陳瑞麟,2012,《認知與評價:科學理論與實驗的動力學》,第二章,〈從觀察到理論:經驗模型的媒介〉。