機器學習自學筆記（2） -- 字典特征抽取

2023-04-30 20:56:50

特征抽取

将任意資料轉化成可用于機器學習的特征資料。

字典特征提取

使用API

sklearn.feature_extraction

對字典提取時，使用

DictVectorizer

方法。

可以把字典轉化成二維數組（矩陣）。

示例：

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction import DictVectorizer

def dict_demo():
    """
    字典特征抽取
    :return:
    """
    data = [{"city":"北京","tem":100},{"city":"上海","tem":53},{"city":"武漢","tem":65}]
    #執行個體化一個轉化類
    transfer = DictVectorizer(sparse=False)
    #調用feat_transform()
    data_new = transfer.fit_transform(data)
    print(transfer.get_feature_names())
    print(data_new)
    return None

if __name__ == '__main__':
    #字典特征抽取
    dict_demo()

結果：

機器學習自學筆記（2） -- 字典特征抽取

當然，

DictVectorizer(sparse=False)

中也可以不寫

sparse=False

，效果

機器學習自學筆記（2） -- 字典特征抽取

機器學習自學筆記（2） -- 字典特征抽取

特征抽取

字典特征提取

繼續閱讀

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

YAML簡介和PyYAML安全操作YAML支援的類型YAML的優點：yaml的基本文法python操作

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

Small tricks

libsvm for python 安裝

學習軟體測試基礎測試第七天

Zeppelin 配置通路 REST APIApache Zeppelin Configuration REST API

【Torch】最簡潔logging使用指南

27. Remove Element(清單)題目代碼

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入