keras.utils.Sequence使用注意事項

2022-12-19 18:37:06

1）在實作自己的DataLoader過程中一般都是繼承自keras.utils.Sequence，繼承該類必須要實作__len__與__getitem__兩個函數。

2）在調用fit_generator進行訓練時，如果設定了step_per_epoch參數，則每個epoch訓練step_per_epoch個step，每個step有batch_size資料，是以每個epoch共訓練step_per_epoch*batch_size的資料。如果沒有設定step_per_epoch參數，則每個epoch訓練的step個數由__len__決定。

3）在訓練過程中step_per_epoch的個數可以大于 ceil(float(資料集圖檔數量)/batch_size) ，這個數字可以認為是周遊一遍資料集需要的實際step數量，__len__一般也實作為這個數字。在每周遊過一次資料集後（确切的說是調用__len__次），會調用一次on_epoch_end()。

4）__getitem__在調用時會有一個index參數，這個參數的取值範圍就是range(__len__)的結果，index參數的值是在這個範圍内随機給定的。因為__len__實作的時候使用的是ceil向上取整，是以很有可能最後一個index就無法取到一組滿batch資料，因為資料集圖檔數量能夠正好整除batch_size的情況很少。如果沒有取到一組滿batch資料，此時可以傳回None，或者幹脆什麼都不傳回。fit_generator在檢查到是None的時候會再調用__getitem__一次。

5）是以這個地方要特别注意一點，圖檔無論是訓練集還是驗證集的數量一定不能小于batch_size，因為如果圖檔數量小于batch_size，則永遠不能取到一組滿batch，程式就會進入無限循環。另一方面在計算__len__的時候，使用了ceil，那麼__len__至少大于等于1，也不存在不進入__getitem__的情況。除非資料集圖檔數量是0。

keras.utils.Sequence使用注意事項

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

考證大全 | 證券從業資格考試

敲黑闆！2021年證券從業考試考點預測

2021年銀行從業考試考情介紹,果斷收藏!

證券從業合格證書什麼時候列印？有哪些注意事項？

【幹貨滿滿】初級銀行從業考試《個人理财》重點梳理

2020年經濟師考試，難嗎？

初級銀行從業資格證有什麼用？

MBA提前面試純幹貨分享

MBA值得學麼

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

深度學習模型分析人類複雜疾病的準确性

【趨高機器視覺】機器視覺技術原了解析及解決方案

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡