天天看點

vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...

vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...

細菌進化樹

細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定

對于細菌新種或者新屬的發現,總是那麼讓人期待,但是當我們批量獲得16S序列後,逐一對這些尚不知分類地位的序列進行比對并建樹驗證的過程,着實需要花費不少時間和精力,那麼有沒有什麼方法可以一鍵批量建構系統發育樹幫助我們判斷細菌分類地位呢?答案是肯定的,今天就給大家分享一套一鍵化細菌建樹流程,同時流程可提示是否為新種或者新屬(提示:本文實操需要讀者有一定的linux基礎)。

流程下載下傳連結請于公衆号背景回複:細菌進化樹流程,以擷取下載下傳連結~

vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...
vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...
vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...

流程思路

01

vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...
vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...
vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...

子產品介紹

02

溫馨提示:本段所有執行個體截圖将合并在本段末尾,可通讀後一并參考。

Step1序列拆分。流程允許一次提供多個16S序列,最終結果将展示在同一個進化樹中。為了準确判斷每個序列的分類地位,流程首先對多序列進行拆分。

Step2序列比對。對于拆分出的每一條序列,與本地EzBioCloud資料庫進行比對。

Step3判斷是否為新種(新屬),并擷取相關屬清單。該步同時判斷主幹和外群屬資訊。

Step4擷取模式種清單。流程将對主幹屬查詢全部已經發表的模式種(基于EzBioCloud和LPSN),對外群屬查詢給定數量的模式種。

Step5擷取全部模式種的16S序列。流程将優先從本地EzBioCloud資料中抓取,未能抓取到的模式種将嘗試下載下傳。

Step6比對。基于megacc對擷取到的全部序列進行比對。

Step7建構NJ樹。基于megacc建構NJ樹。

Step8建構ML樹。基于megacc計算最優模型,并使用最優模型建構ML樹。

Step9整理結果。流程将對主要中間結果和最終結果進行整理,并打包。

vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...
vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...
vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...
vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...
vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...
vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...
vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...
vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...
vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...
vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...

滑動檢視更多

vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...
vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...
vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...

流程目錄

03

vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...
vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...
vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...

流程使用

04

4.1 軟體依賴

(1)python3 流程腳本全部使用python3解釋,需要使用者自行安裝;

(2)blast、makeblastdb 比對過程使用,需要使用者自行安裝;

(3)mega 流程中自帶,在Software目錄中,若版本不合适,可自行更換。

4.2 配置檔案

流程首次運作之前需要對預設配置進行更改,用以指定軟體路徑及相關配置檔案的路徑。

(1)預設配置檔案 Config/config.txt,需要更改的參數為zip、python3、blastn、makeblastdb、mega、clustal_align_nucleotide、infer_NJ_nucleotide、model_sel_ml_nucleotide、infer_ML_nucleotide;

(2)megacc軟體配置檔案可以直接使用預設,如有門檻值等參數的更改可以進行調整,涉及到的檔案有clustal_align_nucleotide(比對配置)、infer_NJ_nucleotide(NJ建樹配置)、model_sel_ml_nucleotide(ML模型計算配置)、infer_ML_nucleotide(ML建樹配置)。

4.3 流程運作

主流程位于Bin目錄中,是一個makefile,需要用make進行解釋,指令示例如下:

make -f auto_tree.mk Outdir=./ Query=test.fa All

Outdir:結果輸出目錄,沒有會被建立,所有結果儲存在 Outdir 中的 Result 檔案夾内;

Query:待分析序列,可以同時提供多個,所有序列将一同建樹。

4.4 目錄結構

vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...

4.5 結果解釋

(1)all_tree.fa 包含主幹及外群在内的所有模式種16S rDNA 序列,其中外群序列為該屬第一株模式種;

(2)all_tree.species建樹所用的所有模式種資訊,與 all_tree.fa 對應;

(3)M10CC_algn.meg使用給定設定參數對all_tree.fa比對獲得的 alignment 檔案;

(4)M10CC_ML.nwk使用給定設定參數得到的Maximum Likelihood 樹;

(5)M10CC_ML_consensus.nwk從所有的bootstrap、sample ML trees 中得到的 bootstrap consensus 樹;

(6)M10CC_NJ.nwk使用給定設定參數得到的neighbor-joining樹;

(7)M10CC_NJ_consensus.nwk從所有的bootstrap sample NJ trees 中得到的 bootstrap consensus 樹;

(8)SplitSeq_*_1Seq.blast拆分序列與資料庫的比對結果, blastn 的标準 m8 格式;

(9)SplitSeq_*_1Seq.class拆分序列的分類地位判斷結果檔案,"#genus"表示可以确定到屬(是否可能為新種需要檢視SplitSeq_*_1Seq.blast檔案),"#family"表示可以确定到科(即可能為新屬)。

/ Last word /

BIOChrome緻力于建立考研學子與調劑導師溝通橋梁,專注科研前沿和熱點,聊科研趣事,為科研工作者提供交流和學習的平台,希望大家踴躍參與讨論啊!~

--END--

排版 | A_X

圖檔 |兔兔團子&江少

文字 | 江少

vbn中使用的3種流程控制結構是_細菌進化樹建構:從模式種序列下載下傳到建構系統發育樹一鍵搞定...

『BIOChrome』