天天看點

fasta header 重命名

摘要

産生的fasta檔案中的序列名(header),如果是重複的或者是沒有意義的,就需要批量對其進行更改,針對不同目的,有不同的軟體進行處理,seqtk的rename子產品可以重命名重複的header;seqkit的replace子產品可以完全自定義的重命名。

使用方法

# header字首修改為21mer39t_,{nr}為第幾個序列
seqkit replace -p .+ -r "21mer39t_{nr}" -j 120 -t dna -o 21mer_39times_dump_rename.fasta 21mer_39times_dump.fasta
           

更好的方法

可修改old name和new name對應關系的fa-rename