文章目录
-
-
- 前言
-
前言
介绍一个关于气温预测的任务, 这里将数据做了个表格, 数据如图所示
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import torch
features = pd.read_csv('temps.csv')
print(features.head())
这里可以学习下数据预处理,
sklearn
这个库
from sklearn import preprocessing
x = preprocessing.StandardScaler().fit_transform(input)
StandardScaler
有三个小函数,
fit
,
fit_transform
,
transform
- fit
- 用于计算训练数据的均值和方差, 后面就会用均值和方差来转换训练数据
- fit_transform
- 不仅计算训练数据的均值和方差,还会基于计算出来的均值和方差来转换训练数据,从而把数据转换成标准的正太分布
- transform
很显然,它只是进行转换,只是把训练数据转换成标准的正态分布
一般使用方法:
a) 先用fit
scaler = preprocessing.StandardScaler().fit(X)
这一步可以得到scaler,scaler里面存的有计算出来的均值和方差
b) 再用transform
scaler.transform(X)
这一步再用scaler中的均值和方差来转换X,使X标准化
c) 那么在预测的时候, 也要对数据做同样的标准化处理,即也要用上面的scaler中的均值和方差来对预测时候的特征进行标准化
注意:测试数据和预测数据的标准化的方式要和训练数据标准化的方式一样, 必须用同一个scaler来进行transform