下載下傳資料之前你要了解GEO資料庫的4個概念和4個資料存放類型:
GSE資料編号(Series)
GPL資料編号(GEO platforms)
GSM資料編号(Samples)
GDS資料編号(Datasets)
一篇文章可以有一個或者多個GSE(Series)資料集,一個GSE裡面可以有一個或者多個GSM(Samples)樣本,而每個資料集都有着自己對應的晶片平台,就是GPL(GEO
platforms)。GSE編号一般為作者送出時生成的原始資料編号,後續NCBI中的從業人員會根據研究目的、樣品類型等資訊歸納整合為一個GDS(Datasets),整理後的資料還會有GEO
profile資料,也就是基因在這次實驗中的表達資料。GDS裡面的資料往往對應相同的平台具有可比性,另外,不是所有的GSE資料都能被整理,是以,有的GSE資料裡面沒有GDS資料也是正常。
https://zhuanlan.zhihu.com/p/132559646
https://zhuanlan.zhihu.com/p/72484266
https://zhuanlan.zhihu.com/p/340601138