LncRNA與一般mRNA不同,不會轉譯成蛋白。因此,藉由蛋白質家族或是結構來預測可能的功能這條路基本上不可行。一路上陸陸續續看過幾篇文章用不同方式來預測LncRNA的功能,基本上都是利用某中LncRNA的特性(表現量之類的)與現有的mRNA掛勾,如此一來就可以間接使用現成的蛋白質功能資料。
當然每篇文章巧妙各有不同,有些感覺很唬爛,有些好像還真有點意思。比較早期的,像是Genome research 2012 這篇
Genome-wide analysis of long noncoding RNA stability 利用的是RNA的穩定度。邏輯大概如下類似功能的基因,RNA穩定度基本相近,所以LncRNA跟其他穩定度相近的mRNA可能有類似的功能,恩。
今年又順手撈到一篇
In vivo functional analysis of non-conserved human lncRNAs associated with cardiometabolic traits 發表在Nature Communication. 基本上是把LncRNA跟GWAS還有eQTL掛鉤。
GWAS (Genome wide association study):利用每個人體內,基因組內SNP (single nucleotide polymorphism) 的組合不同,建立SNP與疾病 (或是任何指定現象)的連結。
qQTL (expression quantitative trait loci) : 簡單說,類似GWAS概念,建立SNP與基因表現變異的連結。
說得很簡單,不過在deep-seq 出來之前,這事情可想都不用想。就算早期的deep-seq 可能也沒特別針對這塊去處理 -- > 也就是說,全部分析都要重跑一遍,加上不同deep-seq平台跟方法也會有差異,是個大工程來著。
不管怎樣,反正科學家本來就是任性,想知道就會卯起來解決問題
本人。
整體的分析跟後續的驗證看起來也不錯,之後應該會有方便的資料庫可以使用吧?
這幾年看下來,真的生物這一塊對於資訊能力的要求越來越高了,或是說傳統的分子生物到了某個極限,沒有什麼獨門生意可言 (需要燒錢的除外),越來越需要與其他領域結合才能有創新發現啊。