天天看點

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&工具💡 部署機器學習服務💡 場景案例&手把手參考資料

本篇内容 ShowMeAI 将帶大家學習,從頭開始建構機器學習管道,使用 Flask 架構建構 Web 應用程式,并部署到雲伺服器上的過程。具體包括:

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&工具💡 部署機器學習服務💡 場景案例&手把手參考資料
  • 何為機器學習應用部署
  • 基于 PyCaret 開發機器學習全流程
  • 基于 Flask 搭建簡易前端 Web 應用程式
  • 在 Heroku 雲上部署機器學習應用

本示例中的應用為保險金額預估,部署好的雲端服務頁面如下圖所示,可以點選 📘這裡體驗。

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&工具💡 部署機器學習服務💡 場景案例&手把手參考資料

💡 環境&工具

💦 PyCaret

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&工具💡 部署機器學習服務💡 場景案例&手把手參考資料

📘PyCaret 是一個開源的低代碼機器學習庫,用于在生産中訓練和部署機器學習管道/流水線和模型。我們可以通過

pip

安裝 PyCaret。

# 安裝pycaret
pip install pycaret
複制代碼           

複制

💦 Flask

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&工具💡 部署機器學習服務💡 場景案例&手把手參考資料

📘Flask 是一個用于在 Python 中建構 Web 應用程式的輕量化架構。我們本次的應用需要部署成Web端可互動操作使用的形态,會用到這個工具庫,我們同樣可以通過

pip

安裝它。

# 安裝flask
pip install flask
複制代碼           

複制

💦 Heroku

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&工具💡 部署機器學習服務💡 場景案例&手把手參考資料

📘 Heroku 是一個平台即服務(PaaS),它支援基于托管容器系統部署 Web 應用程式,具有內建的資料服務和強大的生态系統。我們将基于它将應用程式部署到雲端,進而大家可以直接通過 URL 在浏覽器端通路應用。

💡 部署機器學習服務

在企業的實際生産中,我們經常會把機器學習模型建構成服務形态,這樣協作的開發同僚可以通過接口(API)來通路模型服務,完成預估任務,這被稱為部署機器學習應用過程。

更全一點說,生産中使用機器學習管道有兩種廣泛的方式:

  • 批量預測

将模型或管道存儲在磁盤中,定期運作腳本,加載模型和資料,生成預測并将輸出寫入磁盤。這種情況下,多個預測會并行。它對于時效性要求不高。

  • 線上預測

需要實時預測,大家使用到的很多 app,其實都是輸入資訊,然後在單擊送出按鈕時,實時預估生成預測的。比如你在電商平台輸入搜尋詞,點選查詢,可以看到模型排序好的結果清單傳回。

本教程中,我們講解的是『線上預測』這種模式。我們将首先使用 PyCaret 在 Python 中建構機器學習管道,然後使用 Flask 建構 Web 應用程式,最後将所有這些部署在 Heroku 雲上。

整個機器學習管道(pipeline)如下圖所示:

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&工具💡 部署機器學習服務💡 場景案例&手把手參考資料

💡 場景案例&手把手

本案例中用作示例的資料來自保險場景,保險公司希望通過使用人口統計學資訊和基本患者健康風險特征,更準确地預測患者保單費用,以優化其使用的現金流預測的準确性。資料是 PyCaret 自帶的,資料的簡單速覽如下:

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&工具💡 部署機器學習服務💡 場景案例&手把手參考資料

下面我們逐漸完成機器學習管道建構與雲端部署的過程。

💦 第一步:建構機器學習流水線

我們把整個模組化過程建構為一個流水線,這裡我們使用 PyCaret,幾乎可以自動化地完成這個過程。

# 加載資料
from pycaret.datasets import get_data
data = get_data('insurance')

# 初始化設定
from pycaret.regression import *
s = setup(data, target = 'charges', session_id = 123, normalize = True, polynomial_features = True, trigonometry_features = True, feature_interaction=True, bin_numeric_features= ['age', 'bmi'])
複制代碼           

複制

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&工具💡 部署機器學習服務💡 場景案例&手把手參考資料

上述的代碼會自動化完成資料轉換,轉換後的資料集有 62 個用于訓練的特征,這些特征由原始資料集的 7 個特征變換而來。以下為對應的特征清單:

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&工具💡 部署機器學習服務💡 場景案例&手把手參考資料

使用PyCaret進行模組化和評估非常簡單,下面示例代碼中,我們選擇邏輯回歸模型,并進行10折交叉驗證:

# 模型訓練
lr = create_model('lr')
複制代碼           

複制

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&工具💡 部署機器學習服務💡 場景案例&手把手參考資料
# 繪制訓練模型的殘差 
plot_model(lr, plot='residuals')
複制代碼           

複制

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&工具💡 部署機器學習服務💡 場景案例&手把手參考資料

上述流程之後,我們可以使用該

save_model

函數儲存整個模組化流水線。

# 儲存轉換流水線和模型
save_model(lr, model_name='/username/ins/deployment')
複制代碼           

複制

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&工具💡 部署機器學習服務💡 場景案例&手把手參考資料

這樣我們就快速完成了第 1 步,注意,實際業務場景下,大家會做更精細化的資料清洗、特征工程和模型調優,我們本次的目标是給大家示範從模組化到部署的全流程方法,是以這個部分相對簡略。

PyCaret 自動化模組化的輸出是一個流水線/pipeline,包含幾個資料轉換步驟(如特征工程、縮放、缺失值插補等)和機器學習模型。流水線儲存為

pkl

格式的檔案,我們在後續建構 Flask 應用程式會使用到它。

💦 第二步:使用 Flask 建構前端應用程式

在完成我們的機器學習流水線和模型之後,我們要開始開發 Web 應用程式,它由兩個部分組成:

  • 前端(基于 HTML 建構網頁端可顯示和互動的内容)
  • 後端(基于 Flask 開發完成接收請求後可以進行預估的程式)

① Web 應用前端

很多 Web 應用程式的前端都是使用 HTML 建構的,我們在本篇内容中不會深入講解前端相關的内容。為了建構一個輸入表單(以接收使用者實時預估時輸入的字段取值),我們基于一個基本的 HTML 模闆完成前端網頁,然後包含一個 CSS 樣式表。

◉ HTML 代碼實作

以下是我們 Web 應用程式首頁的 HTML 代碼。

<!DOCTYPE html>
<html>
<head>
  <meta charset="UTF-8">
  <title>Predict Insurance Bill</title>
  <link href='https://fonts.googleapis.com/css?family=Pacifico' rel='stylesheet' type='text/css'>
<link href='https://fonts.googleapis.com/css?family=Arimo' rel='stylesheet' type='text/css'>
<link href='https://fonts.googleapis.com/css?family=Hind:300' rel='stylesheet' type='text/css'>
<link href='https://fonts.googleapis.com/css?family=Open+Sans+Condensed:300' rel='stylesheet' type='text/css'>
<link type="text/css" rel="stylesheet" href="{{ url_for('static', filename='./style.css') }}">
  
</head>

<body>
 <div class="login">
    <h1>Predict Insurance Bill</h1>

     <!-- Form to enter new data for predictions  -->
    <form action="{{ url_for('predict')}}"method="POST">
      <input type="text" name="age" placeholder="Age" required="required" /><br>
        <input type="text" name="sex" placeholder="Sex" required="required" /><br>
        <input type="text" name="bmi" placeholder="BMI" required="required" /><br>
        <input type="text" name="children" placeholder="Children" required="required" /><br>
        <input type="text" name="smoker" placeholder="Smoker" required="required" /><br>
        <input type="text" name="region" placeholder="Region" required="required" /><br>

        <button type="submit" class="btn btn-primary btn-block btn-large">Predict</button>
    </form>

   <br>
   <br>
  
   
 </div>
 {{pred}}

</body>
</html>
複制代碼           

複制

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&amp;工具💡 部署機器學習服務💡 場景案例&amp;手把手參考資料
大家如果要建構簡單的應用程式,不需要專門去學一遍 HTML 的進階知識。大家在網際網路上可以找到大量 HTML 和 CSS 模闆,甚至有些 📘線上平台 可以通過使用拖拽建構使用者界面,并快速生成對應的 HTML 代碼。

◉ CSS 樣式表 CSS 負責描述 HTML 元素在螢幕上的呈現樣式,借助 CSS 可以非常有效地控制應用程式的布局。存儲在樣式表中的資訊包括邊距、字型大小和顔色以及背景顔色。這些資訊以 CSS 擴充名的檔案格式存儲在外部位置,主 HTML 檔案包含對 CSS 檔案的引用。

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&amp;工具💡 部署機器學習服務💡 場景案例&amp;手把手參考資料

② Web 應用後端

下面我們完成這個應用的後端,我們在 Python 中可以使用 Flask 工具庫完成。關于 Flask 的詳細知識大家可以參考 📘官方網站。我們的部分代碼如下:

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&amp;工具💡 部署機器學習服務💡 場景案例&amp;手把手參考資料

在雲端部署之前,我們需要在本地測試應用是否正常工作。我們在指令行運作

python app.py

python app.py
複制代碼           

複制

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&amp;工具💡 部署機器學習服務💡 場景案例&amp;手把手參考資料

上圖中大家可以在最後一行看到本地的測試 URL,我們把它粘貼到浏覽器可以檢視 Web 應用程式是否正常。我們還可以通過輸入一些測試資料來檢查預測功能是否正常運作。如下例中,我們輸入資訊:19 歲、吸煙、西南地區、沒有孩子、女性,模型預測住院費用為 20900 美元。

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&amp;工具💡 部署機器學習服務💡 場景案例&amp;手把手參考資料

好啦,測試完畢,完全可以正常工作,我們在下一步把它部署到雲端。

💦 第三步:在 Heroku 上部署 ML 流水線和應用程式

模型訓練完成後,機器學習流水線已經準備好,且完成了本地測試,我們現在準備開始部署到 Heroku。有多種方法可以完成這個步驟,最簡單的是将代碼上傳 GitHub ,并連接配接 Heroku 帳戶完成部署。

下圖是上傳好的截圖,大家可以在 📘www.github.com/pycaret/dep… 檢視。

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&amp;工具💡 部署機器學習服務💡 場景案例&amp;手把手參考資料

将所有檔案上傳到 GitHub 後,我們就可以開始在 Heroku 上進行部署了。如下為操作步驟:

① 注冊并點選 『 建立新應用 』

在 📘heroku 上可以完成上述操作,如下圖所示

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&amp;工具💡 部署機器學習服務💡 場景案例&amp;手把手參考資料

② 輸入應用名稱和地區

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&amp;工具💡 部署機器學習服務💡 場景案例&amp;手把手參考資料

③ 連接配接到托管代碼的 GitHub 存儲庫

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&amp;工具💡 部署機器學習服務💡 場景案例&amp;手把手參考資料

④ 部署分支

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&amp;工具💡 部署機器學習服務💡 場景案例&amp;手把手參考資料

⑤ 等待部署完成

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&amp;工具💡 部署機器學習服務💡 場景案例&amp;手把手參考資料

部署完成後,在有網絡的情況下,就都可以通路對應的應用程式了 📘https ://pycaret-insurance.herokuapp.com/。

工業場景全流程!機器學習開發并部署服務到雲端💡 環境&amp;工具💡 部署機器學習服務💡 場景案例&amp;手把手參考資料

參考資料

  • 📘 PyCaret:www.pycaret.org/
  • 📘 Flask:flask.palletsprojects.com/en/2.2.x/
  • 📘 Heroku:www.heroku.com/
  • 📘 HTML 和 CSS 模闆線上平台:www.vvveb.com/vvvebjs/edi…
  • 📘 Flask 的詳細知識:dormousehole.readthedocs.io/en/latest/
工業場景全流程!機器學習開發并部署服務到雲端💡 環境&amp;工具💡 部署機器學習服務💡 場景案例&amp;手把手參考資料