【考試記錄】Apsara Clouder大資料技能認證：基于機器學習的客戶流失預警分析

2023-07-31 15:51:40

一：考試總結

這個考試說實話，已經過時了，因為實驗中用的版本是老版本，而阿裡在今年2020年已經有了V2.0，是以，實驗可以不用做了，至于知識點還是可以好好學習的，畢竟有很多幹貨。至于原題，沒有搜到，自己硬着頭皮做的，一次過，幸虧研究所學生學的是大資料和機器學習，是以這個的考試還是比較容易的，如果沒有相關基礎的話，好好看官方視訊，也是能過的，考的題目都在PPT裡出現過，多看幾遍沒問題的。

二：真題

回憶：好多都是跟基本概念有關的，ID3,C4.5,C50這三個概念考了。

【考試記錄】Apsara Clouder大資料技能認證：基于機器學習的客戶流失預警分析
下面的表格是重點

【考試記錄】Apsara Clouder大資料技能認證：基于機器學習的客戶流失預警分析

【考試記錄】Apsara Clouder大資料技能認證：基于機器學習的客戶流失預警分析

考了內建學習：針對同一資料集，訓練多種學習器，來解決同一問題，包括什麼，他們的差別是什麼。

特征工程：最大限度地從原始資料中提取特征以供算法和模型使用

資料預處理：标準化、縮放、缺失值、變換、編碼等

特征産生：結合業務資料，派生新的特征

特征選擇：通過各種統計量、模型評分等，篩選合适的特征

降維：PCA、LDA等減少特征個數能用更少的模型得出好的結果，就盡量不要用太多的模型。模型越多，受影響越多。

模型評估:解釋&泛華

解釋：模型能夠很好的解釋資料集叫做解釋型模型

泛化：把一個模型使用在新的資料集上，如果表現非常糟糕，說明泛化能力差（顧名思義。使用廣泛化）

過拟合：在原來的資料集表現的非常好，在另一個資料集上又太差了。這就是泛化能力差，也即是過拟合

随機森林也考了。

其實，隻要把視訊好好看，外加點機器學習的基礎，還是很容易的，如果是小白的話，那就多看幾遍。

【考試記錄】Apsara Clouder大資料技能認證：基于機器學習的客戶流失預警分析

【考試記錄】Apsara Clouder大資料技能認證：基于機器學習的客戶流失預警分析

一：考試總結

二：真題

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

【分類算法】什麼是分類算法定義分類與聚類分類過程方法

分類算法的評價名額

K-近鄰算法以及圖像分類應用

weka之NB算法

使用weka的select attribute

weka中分類器算法

在weka中內建自己的算法

【多變量線性回歸】學習記錄序思路實作終

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告