您的瀏覽器不支援JavaScript功能,若網頁功能無法正常使用時,請開啟瀏覽器JavaScript狀態
:::

Integrating AI into Imbalanced Data Learning

探討機器學習中常見的不平衡資料問題

日期: 2025年6月2日
時間: 13:10-14:10
地點: ST635
主講人: 許一凡 助理教授 (德克薩斯農工大學金斯維爾分校)
主辦單位: 東海大學智慧計算暨應用數學系

講座摘要

在機器學習領域,不平衡資料問題長期困擾研究者與實務工作者。當少數類別樣本稀少時,傳統模型預測往往產生嚴重偏誤,影響決策品質。

本研究系統性回顧並比較多種合成資料生成方法,包括SMOTE、ROSE、GANs與Autoencoder等技術,並在四組不同特性的資料集上結合SVM、隨機森林、XGBoost等分類器進行實證分析。

實驗結果顯示,AI生成技術能顯著提升模型在不平衡情境下的表現,特別當與傳統方法結合時,不僅提高少數類別的識別率,同時維持整體預測穩定性。

講座亮點

  • 深度解析不平衡資料對不同機器學習模型的影響機制
  • 比較四種主流合成資料生成技術的優劣與適用場景
  • 展示跨資料集的實證結果與可解釋性分析
  • 提出整合AI生成技術與傳統方法的最佳實踐框架