❝ 本文示例代碼及檔案已上傳至我的 Github
倉庫https://github.com/CNFeffery/DataScienceStudyNotes ❞
1 簡介
就在幾天前,
pandas
釋出了其1.3版本,在這次新的版本中添加了諸多實用的新特性,今天的文章我們就一起來get其中主要的一些内容更新~
2 pandas 1.3主要更新内容一覽
使用
pip install pandas==1.3.0 -U -i https://pypi.douban.com/simple/
安裝1.3版本後,下面我們來看看新的版本給我們帶來了哪些新特性:
2.1 新增對xml檔案的讀寫操作
在這次新版本中新增了對
xml
格式資料進行解析讀寫的功能,對此有特殊需求的朋友可以前往
https://pandas.pydata.org/docs/user_guide/io.html#xml
詳細了解:
2.2 Styler可使用原生css文法
很多朋友都知道
pandas
中可以配合
Styler
對資料框進行自定義樣式輸出,其中最自由的是通過
Styler.set_table_styles()
來自定義
css
樣式,以前的方式需要将一條
css
屬性寫到二進制組中傳入,在1.3版本中可以直接傳入
css
字元串,比如下面我們通過設定hover僞類樣式,來修改每一行滑鼠懸停時的樣式:
2.3 center參數在時間日期index的資料框rolling操作中可用
在先前的版本中,如果針對行索引為時間日期型的資料框進行
rolling
滑窗操作使用
center
參數将每行記錄作為視窗中心時會報錯:
而在1.3中這個問題終于得到解決~友善了許多時序資料分析時的操作:
2.4 sample()随機抽樣新增ignore_index參數
我們都知道在
pandas
中可以使用
sample()
方法對資料框進行各種放回/不放回抽樣,但以前版本中抽完樣的資料框每行記錄還保持着先前的行索引,使得我們還得多一步
reset_index()
操作,而在1.3中,新增類似
sort_values()
和
drop_duplicates()
中的同名參數
ignore_index
:
2.5 explode()新增多列操作支援
當資料框中某些字段某些位置元素為清單、元組等資料結構時,我們可以使用
explode()
方法來基于這些序列型元素進行展開擴充,但在以前的版本中每次
explode()
操作隻支援對單個字段的展開,如果資料中多個字段之間同一行對應序列型元素位置是一一對應的,需要展開後也是一一對應的,操作起來就比較棘手。
而1.3版本中直接對多字段同步
explode()
進行了支援:
2.6 append模式下寫出多工作表excel檔案的新政策
在1.3版本中,針對
mode='a'
模式下向外寫出多工作表
excel
檔案,新增了參數
if_sheet_exists
來設定新工作表與已存在工作表重名時的處理政策,預設為
'error'
即直接抛出錯誤,
'new'
則會自動修改工作表名,
'replace'
則會覆寫原同名工作表:
2.7 結合SQL讀取資料庫表時可直接設定類型轉換
在1.3版本中,我們在使用
read_sql_query()
結合
SQL
查詢資料庫時,新增了參數
dtype
可以像在其他API中那樣一步到位轉換查詢到的資料:
以上就是本文的全部内容,歡迎在評論區與我進行讨論~
往期精彩回顧
适合初學者入門人工智能的路線及資料下載下傳機器學習及深度學習筆記等資料列印機器學習線上手冊深度學習筆記專輯《統計學習方法》的代碼複現專輯
AI基礎下載下傳機器學習的數學基礎專輯溫州大學《機器學習課程》視訊
本站qq群851320808,加入微信群請掃碼: