Pandas——Dataframe行周遊幾種常用方法性能分析

2023-05-15 00:06:38

pandas作為python資料分析的一大利器，為廣大資料分析人員使用。今天無意中，聽到美女同僚吐槽：dataframe好慢啊！嗯哼，瞬間引起了我這個資料人的注意，過去一看，原來是用的方法本身效率低。

日常工作中，按照行周遊資料是我們一個非常常見的場景！尤其是從sql boy轉到資料分析的我，動不動就想

select * from table1;

一下，看看資料的大概情況。這一操作在pandas中的實作主要有一下幾種：

1、iterrows()

原理是将Dataframe疊代為Series，再傳回結果。這一過程中需要進行類型檢查，是以，會花費很長的時間。（不建議使用）

for index, row in df.iterrows():
     #字典方式通路
     print(index, row['c1'], row['c2'])

2、itertuples()

原理是将Dataframe疊代為tuple，再進行傳回，由于元組不可變的特性，此過程不需要進行類型檢查。（效率高，推薦使用）

for row in student.itertuples():
    # print(row)
    print(row.Index, row.name, row.account, row.pwd)
    print(row.Index, getattr(row,'name'), getattr(row,'account'), getattr(row,'pwd'))

3、for + zip

這種方法是直接手動構造原生tuple，無需關心index資料。（效率高，推薦使用）

for A, B in zip(df['A'], df['B']):
    print(A, B)

Pandas——Dataframe行周遊幾種常用方法性能分析

1、iterrows()

2、itertuples()

3、for + zip

繼續閱讀

來自python的【條件控制/語句循環/break/continue/else/pass】一、條件控制二、語句循環

無法解析的外部符号 wmain，該符号在函數 "void cdecl mainCRTStartupHelper(struct HINSTANCE *,unsigned short con......

TestLink導出用例轉換工具(XML2Excel)

YAML簡介和PyYAML安全操作YAML支援的類型YAML的優點：yaml的基本文法python操作

Small tricks

libsvm for python 安裝

學習軟體測試基礎測試第七天

Zeppelin 配置通路 REST APIApache Zeppelin Configuration REST API

【Torch】最簡潔logging使用指南

27. Remove Element(清單)題目代碼

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入