文章目錄
-
-
- 前言
-
前言
介紹一個關于氣溫預測的任務, 這裡将資料做了個表格, 資料如圖所示
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import torch
features = pd.read_csv('temps.csv')
print(features.head())
這裡可以學習下資料預處理,
sklearn
這個庫
from sklearn import preprocessing
x = preprocessing.StandardScaler().fit_transform(input)
StandardScaler
有三個小函數,
fit
,
fit_transform
,
transform
- fit
- 用于計算訓練資料的均值和方差, 後面就會用均值和方差來轉換訓練資料
- fit_transform
- 不僅計算訓練資料的均值和方差,還會基于計算出來的均值和方差來轉換訓練資料,進而把資料轉換成标準的正太分布
- transform
很顯然,它隻是進行轉換,隻是把訓練資料轉換成标準的正态分布
一般使用方法:
a) 先用fit
scaler = preprocessing.StandardScaler().fit(X)
這一步可以得到scaler,scaler裡面存的有計算出來的均值和方差
b) 再用transform
scaler.transform(X)
這一步再用scaler中的均值和方差來轉換X,使X标準化
c) 那麼在預測的時候, 也要對資料做同樣的标準化處理,即也要用上面的scaler中的均值和方差來對預測時候的特征進行标準化
注意:測試資料和預測資料的标準化的方式要和訓練資料标準化的方式一樣, 必須用同一個scaler來進行transform