天天看点

GEO 数据介绍及在线下载

下载数据之前你要了解GEO数据库的4个概念和4个数据存放类型:

GSE数据编号(Series)

GPL数据编号(GEO platforms)

GSM数据编号(Samples)

GDS数据编号(Datasets)

一篇文章可以有一个或者多个GSE(Series)数据集,一个GSE里面可以有一个或者多个GSM(Samples)样本,而每个数据集都有着自己对应的芯片平台,就是GPL(GEO

platforms)。GSE编号一般为作者提交时生成的原始数据编号,后续NCBI中的工作人员会根据研究目的、样品类型等信息归纳整合为一个GDS(Datasets),整理后的数据还会有GEO

profile数据,也就是基因在这次实验中的表达数据。GDS里面的数据往往对应相同的平台具有可比性,另外,不是所有的GSE数据都能被整理,所以,有的GSE数据里面没有GDS数据也是正常。

https://zhuanlan.zhihu.com/p/132559646

https://zhuanlan.zhihu.com/p/72484266

https://zhuanlan.zhihu.com/p/340601138