天天看點

純資料挖掘之仔豬的長非編碼RNA的鑒定标題:Transcriptome Analysis Suggests the Roles of Long Intergenic Non-coding RNAs in the Growth Performance of Weaned Piglets

咱們《生信技能樹》的B站有一個lncRNA資料分析實戰,缺乏配套筆記,是以我們安排了100個lncRNA組裝案例文獻分享,以及這個流程會用到的100個軟體的實戰筆記教程!

下面是100個lncRNA組裝案例文獻分享

标題:Transcriptome Analysis Suggests the Roles of Long Intergenic Non-coding RNAs in the Growth Performance of Weaned Piglets

标題:轉錄組分析揭示基因間區lncRNA在斷奶仔豬生長中的作用

雜志:Frontiers in Genetics. (2019)

通訊作者:李長春

機構:華中農業大學 動物科學技術學院 農業動物遺傳育種與繁殖教育部重點實驗室;

文章連結:https://doi.org/10.3389/fgene.2019.00196

釋出時間:18 March 2019

摘要:

基因間區lncRNA被認為在各種生物過程中起着關鍵的調節作用。越來越多的研究利用轉錄組分析來獲得具有癌症相關功能的lincRNAs,但很少有人描述影響斷奶仔豬生長速度的lincRNAs。雖然在各種小鼠組織和細胞系中已經系統地鑒定了lincRNA,但在豬中對lincRNA的研究仍然很少。是以,尋找和鑒定影響斷奶仔豬生長性能的新的lincRNA具有重要意義。

在這裡,我們重建了101,988個lincRNA轉錄本,并根據已公布的RNA-seq資料集,在兩組背最長肌(LDM)和皮下脂肪(SF)中鑒定了1,078個lincRNA。這些lincRNA表現出典型的特征,比如相對于蛋白質編碼基因,長度較短,表達水準較低。基因本體論分析表明,一些lincRNAs可能參與了斷奶仔豬胰島素抵抗和AMPK信号通路等相關過程。我們還比較了差異表達的lincRNAs(DELs)和數量性狀位點(QTL)之間的位置關系,發現其中一些DELs可能在仔豬的生長發育中起着重要的作用。

我們的工作詳細介紹了可能影響斷奶仔豬生長性能的部分lincRNAs,并促進了對lincRNAs用于斷奶仔豬分子輔助發育的未來研究。

關鍵詞:lincRNA,RNA-seq,肌肉和脂肪發育,生長性能,斷奶仔豬

斷奶仔豬作為一類非常重要的經濟動物,是典型的生物模型)。新生斷奶仔豬采食量低,生長緩慢,死亡率高;是以,仔豬不容易增重。在斷奶過渡期間,即使調整了環境和營養飼料,也很難保證這些動物的生長速度。先前的研究表明,能量攝入不足和脂肪沉積率降低是仔豬斷奶後發育不良的關鍵因素。我們推測,斷奶過渡期間肌肉和脂肪(仔豬發育的關鍵組織)的發育可能反映了斷奶仔豬生長性能的差異。在之前的一項研究中,豬表現出非常明顯的肥胖,這在其他動物中沒有發現。豬模型已被用于探索由過量脂肪引起的重要疾病,如肥胖、糖尿病、冠心病和動脈硬化。研究豬的肌肉生長也可以使瘦肉型豬的育種提高豬肉使用率)。然而,與人和老鼠相比,對豬的lincRNAs的研究還很少。斷奶仔豬肌肉和脂肪發育的分子機制尚不清楚。

材料方法:

本文就純粹的資料挖掘,采用的公共資料是 GSE65983,是 18個SF樣本 和14 個LDM

  • 豬 基因組, ftp://ftp.ensembl.org/pub/release-93/gtf/sus_scrofa
  • NR 資料庫 ftp://ftp.ncbi.nih.gov/blast/db/

1.比對和轉錄本組裝

  • 質控:FastQC
  • 過濾:Trimmomatic v0.3.2
  • 比對:HISAT2 v2.0.1
  • 組裝:StringTie v1.2.2

2.lincRNA的鑒定

流程圖如下所示:

純資料挖掘之仔豬的長非編碼RNA的鑒定标題:Transcriptome Analysis Suggests the Roles of Long Intergenic Non-coding RNAs in the Growth Performance of Weaned Piglets

3.LincRNAs和蛋白質編碼轉錄本的比較

豬基因組 共有45788個蛋白編碼轉錄本。

4.富集分析

DAVID

5.lincRNA差異分析

DEseq2 | fold change | > 1 and an adjusted p-value of < 0.05

6.利用QTL對DELs的功能預測

QTL資料庫從Animal QTL下載下傳。總共26348個QTL可分為5類,包括(肉和胴體、生産、繁殖、健康和外觀)

結果

1.全基因組lincRNAs鑒定

鑒定到1078個候選lncRNA ,其中198個新lincRNA和880個已知lincRNA。大部分lincRNA主要集中在1和13号染色體。

純資料挖掘之仔豬的長非編碼RNA的鑒定标題:Transcriptome Analysis Suggests the Roles of Long Intergenic Non-coding RNAs in the Growth Performance of Weaned Piglets
  • 新的lincRNA基因的平均轉錄長度為776bp,而已知的lincRNA基因的平均轉錄長度為1159bp,都要短于編碼基因的長度。
  • 新的lincRNA基因的平均外顯子長度為334bp,比已知的lincRNA基因(431bp)短,但比蛋白質編碼基因(283bp)長。
  • 蛋白質編碼基因的平均外顯子數為11.7個,顯著高于新的lincRNA基因(2.3個)和已知的lincRNA基因(2.7個)。
  • 新的lincRNA的FPKM略低于已知的lincRNA,顯著低于編碼基因。

2.LincRNAs的組織表達譜研究

純資料挖掘之仔豬的長非編碼RNA的鑒定标題:Transcriptome Analysis Suggests the Roles of Long Intergenic Non-coding RNAs in the Growth Performance of Weaned Piglets

LDM and SF groups.的比較,使用R包, 差異表達的lincRNA (254個上調,337個下調), lincRNA基因比蛋白質編碼基因表現出更具組織特異性。

3.富集分析

探讨lincRNAs與其鄰近蛋白編碼基因的表達關系,在lincRNA(<100kb) 附近轉錄的表達蛋白編碼基因進行了GO分析和KEGG分析,2251個蛋白質編碼基因中有955個顯著參與了84個生物過程和37個途徑。

許多蛋白質編碼基因參與肌肉生長和脂肪沉積的生物學過程或途徑。從所有的結果中選擇了與肌肉發育和脂肪沉積相關的生物學過程和途徑,包括葡萄糖穩态、糖原代謝、脂質運輸、皮質肌動蛋白細胞骨架組織、胰島素受體信号通路、胰島素抵抗和AMPK信号通路(圖4B,C)。對這些途徑中編碼蛋白質的基因進行富集分析,發現有12個基因多次出現,其中AKT和IRS1基因在所有途徑中出現了4次。根據先前的研究,AKT可能作用于MYOD,進而影響肌肉分化(Li X.等,2018年)。此外,(Li D.et al.2018)發現lncHR1可作用于AKT,抑制SREBP1C水準,調節脂肪代謝。朱等人于2018年發現miR-146b通過靶向IRS1調節豬原代脂肪細胞的葡萄糖穩态。這些研究表明,發現的靶基因确實能夠調節肌肉發育和脂肪代謝。

純資料挖掘之仔豬的長非編碼RNA的鑒定标題:Transcriptome Analysis Suggests the Roles of Long Intergenic Non-coding RNAs in the Growth Performance of Weaned Piglets

4.lincRNA功能預測

大量lncRNA的功能是未知的,但是它們主要是cis-regulators,是以可以根據它們臨近的蛋白編碼基因功能來近似推斷,然後表達量的相關性也可以類推到。

  • 根據位置關系推斷 使用bedtools等工具!
  • 表達量的相關性, 比如雜志Cancer Medicine, 2020的文章《 Genome-wide DNA methylation analysis by MethylRad and the transcriptome profiles reveal the potential cancer-related lncRNAs in colon cancer》,在進行結直腸癌相關lncRNA的功能富集分析,就是采用LncRN2Target v2.0和StarBase分析與15個lncRNA共表達的蛋白編碼基因,其中lncRNA HULC和ZNF667-AS1分别鑒定到28個、9個共表達的蛋白編碼基因!

本文的研究者将所有的lincRNAs和DELs與豬QTL資料庫進行比較,以推測已鑒定的lincRNA的功能。1078個lincRNAs 對應501個QTL區,881個DELs對應482QTLs。

18個QTL具有多種功能,包括平均日增重、肌纖維發育和肌内脂肪,所有這些QTL都與斷奶仔豬的肌肉和脂肪發育有關。然後,我們對QTL的平均日增重 (豬的體重除以飼養的天數)進行了研究,發現93個lincRNAs落在QTL區間内,分布在所有染色體上。

純資料挖掘之仔豬的長非編碼RNA的鑒定标題:Transcriptome Analysis Suggests the Roles of Long Intergenic Non-coding RNAs in the Growth Performance of Weaned Piglets

差異表達lincRNA MSTRG.4163可以調節差異表達的潛在靶基因ADRB3 。ADRB3的激活刺激cAMP作用于PKA,并通過HSL磷酸化促進脂解。cAMP可以調節AKT的表達,進而改變糖代謝。