存储领域一直围绕着高可靠、高可用、高扩展、低成本和高 性能而不断发展。随着互 联网应用的蓬勃发展和企业 数字化的转型,数据迎来爆炸式增长,2020年全球产生的数据预估是 59ZB, 2025年预计达到 175ZB。一方面 ,数据的形态多样化,尤其是非结构化数据(如文本、图片、音频和视频的数据)的增长速度更快 ,2025 年占比将达到 80%。另一方面 ,数据是新的“ 石油”,基千数据的智能分析和智能决策成为数字经济的新常态。尽管产生了大量的数据,但是只有大 约 10% 的数据被存储下来 ,大约只有 5% 的数据被分析过,低成本、易管理、易分析的存储需求 驱动了对象存储的产生和发展。
对象存储提供简 单易扩展的名字空间,它通过 RESTful接口提供了在任何时间、任何地点、任何互联网设备上进 行上传和下载数据的能力 。通过分布式存储技术 的加持,跨数据中心和跨地域的容错能力 ,对象存储具备低成本 、高可靠和易扩展的优势 。对象存储在合规性、安全性、管理、生态、数据湖等领域不断发展,满足业务的需求,促进业务的创新。随着云计算的发展,对象 存储已成为事实标准的云存储。
存储的基本要求是数据不 丢不错,随时可以访问。这些看似简单的要求在数据中 心规模和互联网访问规模下对技术带来 极大 的挑战。本书结合阿里云十几年在分布式 存储领域和对象存储领域的研发实践,理论结合实践阐述了对象存储领域的关键技术,深入地分析和总结了阿里云存储的实践和创新,希望能帮助读者更加深入地了解分布式存储的核心技术,更好地认识对象存储的技术挑战及其在阿里云实践过程中的经验和教训,从而更高效地用好云存储,更快更好地借助云计算进行业务创新。
吴结生
阿里云高级研究员
2021年7月于西雅图