我們現在可以在 24 小時之內,跑完 510 億次的統計檢定,研究單個突變或單個基因的影響
- Slavé Petrovski, VP, AstraZeneca
在生技藥物產業中,「時間就是金錢」可以說是最重要的準則。由於藥廠必須等到新藥通過政府許可,並正式上市之後,才能開始認列收入。因此研究時期每天消耗的可觀資本,都讓每間製藥廠商頭疼不已,並竭盡全力地想增加研發效率。近年,科學家們探索出人類大部分的基因序列,然而,想在變化萬千的人體機轉和近三十億個 DNA 鹼基對中找到答案,也不是件容易的事。需要的不僅是數以年計的研發時間,更需要許多產業專家畢生的心血結晶。
世界知名藥廠 AstraZeneca 便是生物製劑的指標企業,其致力於三大領域:腫瘤、心血管腎臟代謝、呼吸道與免疫。最近幾年,大多數人類基因被解密後,AstraZeneca 也全力發展精準醫療,以及基因體學在新藥發展的應用。為了最快取得有用的基因資訊,AstraZeneca 採用 Amazon Web Service (AWS) 在短時間內處理以 PB 計算的大量基因原始資料,有了 AWS 強大的計算能力支持,生物學家們可以放下手邊重覆性高、相對價值低的工作,把時間花在更有價值的創新研發上。同時 AWS 也能根據動態需求調整所需資源,隨時滿足頂尖性能,又能兼顧成本控制。
AstraZeneca 原有的作業流程包含匯入原始序列、辨識基因組、找出基因變異等不同階段。AWS 在每個階段都能提供符合需求的不同服務:
AWS Lambda:藉由事件驅動的無伺服器解決方案,AstraZeneca 不必再煩心機房的建置維護,只需按照執行的持續時間支付費用,即可部署快速,高彈性的服務。
AWS Batch:因應每次輸入資料的規模來源不同,AWS Batch 可以自動判斷出最適合的運算資源種類和數量,像是該使用運算優化或記憶體優化的主機。
Amazon S3:在所有過程中產生的資料,都存在可靠的物件儲存空間 Amazon S3 裡,提供頂規可用性、安全性的同時,也允許冷熱資料存放在不同的儲存類別以優化成本,輕鬆管理雲端資料。
使用 AWS 服務後,原先耗時且龐雜的分析結果,如今已唾手可得,AstraZeneca 的生物學家們得以大幅加快整體生產速度及規模,因為現在他們可以隨時、隨需取用高效的運算資源,即便在一天內完成 510 億筆統計檢定也不成問題。AstraZeneca 的基因研究中心期望在 2026 年前,完成 200 萬個基因組的分析。