特征抽取
将任意資料轉化成可用于機器學習的特征資料。
字典特征提取
使用API
sklearn.feature_extraction
對字典提取時,使用
DictVectorizer
方法。
可以把字典轉化成二維數組(矩陣)。
示例:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction import DictVectorizer
def dict_demo():
"""
字典特征抽取
:return:
"""
data = [{"city":"北京","tem":100},{"city":"上海","tem":53},{"city":"武漢","tem":65}]
#執行個體化一個轉化類
transfer = DictVectorizer(sparse=False)
#調用feat_transform()
data_new = transfer.fit_transform(data)
print(transfer.get_feature_names())
print(data_new)
return None
if __name__ == '__main__':
#字典特征抽取
dict_demo()
結果:
![](https://img.laitimes.com/img/__Qf2AjLwojIjJCLyojI0JCLiAzNfRHLGZkRGZkRfJ3bs92YsYTMfVmepNHLyUFRNJzZE9EMRpHW4Z0MMBjVtJWd0ckW65UbM5WOHJWa5kHT20ESjBjUIF2X0hXZ0xCMx81dvRWYoNHLrdEZwZ1Rh5WNXp1bwNjW1ZUba9VZwlHdssmch1mclRXY39CXldWYtlWPzNXZj9mcw1ycz9WL49zZuBnLxIzMwIzNyUTM5IjNwAjMwIzLc52YucWbp5GZzNmLn9Gbi1yZtl2Lc9CX6MHc0RHaiojIsJye.png)
當然,
DictVectorizer(sparse=False)
中也可以不寫
sparse=False
,效果