Integrating AI into Imbalanced Data Learning

探討機器學習中常見的不平衡資料問題

日期： 2025年6月2日

時間： 13:10-14:10

地點： ST635

主講人：許一凡助理教授 (德克薩斯農工大學金斯維爾分校)

主辦單位：東海大學智慧計算暨應用數學系

在機器學習領域，不平衡資料問題長期困擾研究者與實務工作者。當少數類別樣本稀少時，傳統模型預測往往產生嚴重偏誤，影響決策品質。

本研究系統性回顧並比較多種合成資料生成方法，包括SMOTE、ROSE、GANs與Autoencoder等技術，並在四組不同特性的資料集上結合SVM、隨機森林、XGBoost等分類器進行實證分析。

實驗結果顯示，AI生成技術能顯著提升模型在不平衡情境下的表現，特別當與傳統方法結合時，不僅提高少數類別的識別率，同時維持整體預測穩定性。