利用Spark解析Tomcat日志，并将統計結果存入Mysql資料庫

2021-11-07 17:28:51

本文試圖實作的需求場景為：以學習spark知識點為目的，編寫scala利用spark解析800m的tomcat日志檔案，列印一段時間内error級别記錄的前10行，統計每分鐘的日志記錄數，并将統計結果存入mysql資料庫中。之前曾用java寫過一次同樣的處理邏輯，但在學習了scala之後，真的感覺在計算方面scala要比java友善的多。沒有學習scala語言的同學速度速度了啊……

将日志檔案寫入hdfs中，相對路徑path為“nova.log”

注意java堆棧異常日志的處理

将解析後的異常日志全部存到sparksql中或hive資料倉庫中

通過編寫sql查詢一段時間内error級别記錄的前10行

統計每分鐘的日志記錄數，并将統計結果存入mysql資料庫中,便于上層應用直接使用計算結果

解析前：

解析後：

loggerapp.scala：

logger.scala：

loggermysqlapp.scala：

利用Spark解析Tomcat日志，并将統計結果存入Mysql資料庫

繼續閱讀

Java String.format方法的簡單使用

neo4j之cypher使用文檔

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

NOSQL安全攻擊

mybatis_入門程式Mybatis入門

AOP程式設計_Android優雅權限架構(1)概念基礎，2021金三銀四前言正文大綱正文

登入plsql 報錯 the account is locked --使用者被鎖

sqlServer根據經緯查距離

Effective Java 8:通用程式設計

SequoiaDB巨杉資料庫C++驅動概述

OOM三種類型

工廠模式-三種類型

【遞歸】高效率求2的n次幂

win10本地scala和spark安裝安裝scala安裝spark

scala (3) Function 和 Method