2023-175，#每日一悟每日進步##大資料#大資料平台的架構模式1、Lambda架構最成熟、最穩定的架構，核心思想是

2023-06-20 09:53:00

2023-175，#每日一悟每日進步##大資料#

大資料平台的架構模式

1、Lambda架構

最成熟、最穩定的架構，核心思想是将批處理作業和實時流作業分離，各自獨立運作，資源互相隔離。有三個層次：

（1）Batch Layer批處理層，主要負責所有的批處理操作，包含Hive、Spark-SQL或Map-Reduce等技術，資料處理依賴的主資料在該層維護；

（2）Serving Layer，以批處理層的結果資料為基礎，對外提供低延時的資料查詢和ad-hoc查詢服務，本層既可以使用包括關系型資料庫在内的傳統技術，也可以使用Kylin、Presto、Impala或Druid等大資料OLAP産品；

（3）Speed Layer，使用流式計算技術實時處理目前資料，能以實時或近似實時的方式處理大量資料，但無法對全部曆史資料進行操作，主要使用Storm、Spark Streaming或Flink等大資料流計算架構。

2、Kappa架構

是Lambda架構的簡化，使用流計算技術統一批處理和實時處理兩條資料處理的Pipeline。

在技術選型上一般需要這些元件：首先在前端需要有一個消息隊列，如Kafka，其次在Kafka後接一個流計算架構，幾乎所有的資料處理都會發生在流計算架構上，主流的流計算架構有Flink、Spark Streaming或Storm。

3、Smack架構

S、M、A、C、K分别代表了架構使用的5種技術：Spark、Mesos、Akka、Cassandra和Kafka。

Smack使用Akka進行資料采集，然後将資料寫入Kafka，接着使用Spark Streaming進行實時流處理，處理結果和原始資料都寫入Cassandra，核心是利用了Cassandra的多資料中心，将資料透明地備援到兩個Cassandra叢集，一個叢集專門用來接收流處理結果資料，另一個叢集用于批處理分析，供Spark讀寫。

SMACK架構既支援批處理又支援實時處理，在資料處理層面隻依賴Spark，在資料存儲層面隻依賴Cassandra，很好地統一了技術堆棧。

2023-175，#每日一悟每日進步##大資料#大資料平台的架構模式1、Lambda架構最成熟、最穩定的架構，核心思想是

2023-175，#每日一悟每日進步##大資料#大資料平台的架構模式1、Lambda架構最成熟、最穩定的架構，核心思想是

繼續閱讀

#挑戰30天在頭條寫日記##創作達人挑戰賽#如何認識redis?redis是一個非關系型資料庫，基于鍵值對多種資料類型為

關系型資料庫非關系型資料庫差別、使用場景

#騰訊釋出大模型向量資料庫#7月4日，騰訊雲正式釋出AI原生（AINative）向量資料庫TencentCloudVec

mariadb資料庫（一）

基于AJAX和Echarts的大資料平台前端開發：代碼優化與效率提升

鄉村振興大資料平台建設方案(ppt)

OLAP型資料庫是一種強大的資料分析工具，能夠處理複雜的多元資料分析和查詢。什麼是OLAP型資料庫呢？OLAP型資料庫是

8月1日，NineData釋出對Oracle資料庫的全版本支援。衆所周知，Oracle資料庫是一款全球領先的關系型資料庫

自動裝箱和拆箱#程式員#java#圖文掘金計劃#面試程大白筆記：概念：自動裝箱和拆箱是Java為了友善開發者而設計的特性

Redis_01_Redis安裝與使用

Spark Streaming實時流處理項目實戰(二)初識實時流處理1.業務現狀分析2.實時流處理産生背景3.實時流處理概述4.離線計算與試試計算對比5.實時流處理架構對比6.實時流處理架構與技術選型7.實時流處理在企業中的應用

Spark Streaming實時流處理項目實戰(九)Spark Streaming進階帶狀态的算子

scala 程式設計思想--第一部分

【一】基于Ubuntu16.04環境編譯Spark源碼及安裝

spring data JPA中的主鍵政策

十四、MySQL備份和恢複資料庫1、備份和恢複的方法2、使用mysqldump導出3、恢複轉儲檔案4、字元編碼問題5、鎖表系列結語