《大数据系统构建：可扩展实时数据系统构建原理与最佳实践》一1.10　总结

2021-11-08 05:58:27

你已经知道了使用传统技术（如分片）来扩展关系型系统时会出现的错误。而我们面临的问题不仅仅是扩展，因为那会使系统变得更难以管理、扩展，甚至更难理解。在后面的章节中，当介绍如何构建大数据系统时，我们将像注重可扩展性一样注重鲁棒性。你将看到，当用正确的方式构建系统时，鲁棒性和可扩展性都是可以在同一个系统中实现的。

使用lambda架构构建数据系统的好处不仅仅是可扩展，因为你的系统将能够处理更大量的数据、收集更多的数据并获得更多的价值。增加存储数据的数量和类型，将会有更多机会去挖掘数据、生成分析和构建新的应用程序。

使用lambda架构的另一个好处是应用程序的健壮性很好。原因有很多，例如，你将有能力在整个数据集上运行计算来进行迁移或解决出错的事情。你永远不需要处理同一时间模式中有多个活跃版本的情况。当改变模式时，你将有能力将所有数据更新到新的模式。同样的，如果一个错误的算法被不小心部署到生产环境，破坏了所提供的数据，你可以通过重新计算被破坏的数值很容易地解决该问题。如你将见到的，还有许多其他原因使得大数据应用程序的鲁棒性更好。

最后，性能将是更加可预测的。虽然lambda架构作为一个整体是通用和灵活的，但组成系统的各个组件是特定的。当与诸如sql的查询计划比较时，后台很少会有“魔法”发生。这就使我们可以得到更加可预测的性能。

如果你对很多这种信息仍然不确定，也不用担心。我们还有很多内容需要进行探讨，并且将通过本书的课程再次深入讨论本章中介绍的每一个主题。在下一章中，你将开始学习如何构建lambda架构。你会从堆栈的核心开始，即如何对数据集的主副本进行建模和系统化。

《大数据系统构建：可扩展实时数据系统构建原理与最佳实践》一1.10　总结

继续阅读

241 Different Ways to Add Parentheses（C代码版）

【趋高机器视觉】机器视觉技术原理解析及解决方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制规程及特点4． CSMA/CD协议5． CSMA/CD的优点6．结束语

极大似然法(ML)与最大期望法(EM)

MapReduce的几个企业级经典面试案例MapReduce的几个企业级经典面试案例

9.spark Core 进阶2--Cashe

C++ 第十五周报告1--《冒泡法排序》

浅谈企业活动中进行数据分析的重要性

笔试面试题目：滑动窗口(二)

数据结构与算法（27）——排序（二）

Dijkstra--简易版（最短路径）

Ambari介绍和架构原理

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

NOSQL安全攻击

win10本地scala和spark安装安装scala安装spark

hdu7108哈希

《大数据系统构建：可扩展实时数据系统构建原理与最佳实践》一1.10 总结

继续阅读

《大数据系统构建：可扩展实时数据系统构建原理与最佳实践》一1.10　总结