摘要:由于存儲硬體和資料采集技術的不斷發展,越來越多資料正被收集。資料的傳入流量非常的龐大,以至于資料挖掘技術無法跟上其腳步。收集的資料往往有多餘的或不相關的特征/執行個體,它們會限制分類的性能。特征選取和執行個體選取是通過消除無用資料來幫忙緩解該問題的過程。本文提出了一系列使用差分進化算法(differential evolution )的算法,實作特征選取,執行個體選取,以及特征選取和執行個體選取的結合。資料的減少,分類精度和訓練時間與原來的資料和現有的算法有的一拼。十個不同難度資料集中的實驗研究表明:新發展的算法可以成功的減小資料的規模,而且在大多數情況下可以維持合作增加分級性能。此外,計算時間也有着實質性的減少。本次工作是第一次系統性的,在分級中研究一系列特征/執行個體選取算法,且結果表明執行個體選取問題比特征選取問題更難解決,但方法有效的話,就可以大大減小資料的規模并提供巨大的利益。
關鍵詞:差分進化算法·特征選取·執行個體選取·分級
bing xue
學曆:惠靈頓維多利亞大學工程與計算機科學學院博士 研究方向:人工智能,機器學習,大資料/連接配接生物學,統計,工程和數學的資料庫 相關學術論文: ·"a survey on evolutionary computation approaches to feature selection"(ieee transaction on evolutionary computation .aug. 2016) ·"cross-domain reuse of extracted knowledge in genetic programming for image classification"(ieee transaction on evolutionary computation 2016)
via:pricai 2016
ps : 本文由雷鋒網(公衆号:雷鋒網)獨家編譯,未經許可拒絕轉載!
本文作者:章敏