Imbalanced Classification with TPG Genetic Programming: Impact of Problem Imbalance and Selection Mechanisms
In: GECCO 2022 - Genetic and Evolutionary Computation Conference ; https://hal.science/hal-03699228 ; GECCO 2022 - Genetic and Evolutionary Computation Conference, Jul 2022, Boston, United States. pp.1-4, ⟨10.1145/3520304.3529008⟩, 2022
Online
Konferenz
Zugriff:
International audience ; Recent research advances on Tangled Program Graphs (TPGs) have demonstrated that Genetic Programming (GP) can be used to build accurate classifiers. However, this performance has been tested on balanced classification problems while most of the real world classification problems are imbalanced, with both over-represented classes and rare classes. This paper explores the effect of imbalanced data on the performance of a TPG classifier, and proposes mitigation methods for imbalance-caused classifier performance degradation using adapted GP selection phases. The GP selection phase is characterized by a fitness function, and by a comparison operator. We show that adapting the TPG to imbalanced data significantly improves the classifier performance. The proposed adaptations on the fitness make the TPG agent capable to fit a model even with 10 4 less examples than the majority class whereas the revised selection phase of the GP process increases the robustness of the method for moderate imbalance ratios.
Titel: |
Imbalanced Classification with TPG Genetic Programming: Impact of Problem Imbalance and Selection Mechanisms
|
---|---|
Autor/in / Beteiligte Person: | Sourbier, Nicolas ; Bonnot, Justine ; Desnos, Karol ; Majorczyk, Frédéric ; Gesny, Olivier ; Guyet, Thomas ; Pelcat, Maxime ; Institut d'Électronique et des Technologies du numéRique (IETR) ; Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes) ; Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-Nantes Université - pôle Sciences et technologie ; Nantes Université (Nantes Univ)-Nantes Université (Nantes Univ) ; Université de Nantes (UN)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes) ; Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS) ; DGA Maîtrise de l'information (DGA.MI) ; Direction générale de l'Armement (DGA) ; Confidentialité, Intégrité, Disponibilité et Répartition (CIDRE) ; CentraleSupélec-Inria Rennes – Bretagne Atlantique ; Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-SYSTÈMES LARGE ÉCHELLE (IRISA-D1) ; Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA) ; Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique) ; Institut Mines-Télécom Paris (IMT)-Institut Mines-Télécom Paris (IMT)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes) ; Institut Mines-Télécom Paris (IMT)-Institut Mines-Télécom Paris (IMT)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA) ; Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique) ; Institut Mines-Télécom Paris (IMT)-Institut Mines-Télécom Paris (IMT) ; Artificial Evolution and Computational Biology (BEAGLE) ; Laboratoire d'InfoRmatique en Image et Systèmes d'information (LIRIS) ; Université Lumière - Lyon 2 (UL2)-École Centrale de Lyon (ECL) ; Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL) ; Université de Lyon-Institut National des Sciences Appliquées de Lyon (INSA Lyon) ; Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Université Lumière - Lyon 2 (UL2)-École Centrale de Lyon (ECL) ; Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Inria Lyon ; Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria) |
Link: | |
Zeitschrift: | GECCO 2022 - Genetic and Evolutionary Computation Conference ; https://hal.science/hal-03699228 ; GECCO 2022 - Genetic and Evolutionary Computation Conference, Jul 2022, Boston, United States. pp.1-4, ⟨10.1145/3520304.3529008⟩, 2022 |
Veröffentlichung: | HAL CCSD, 2022 |
Medientyp: | Konferenz |
DOI: | 10.1145/3520304.3529008 |
Schlagwort: |
|
Sonstiges: |
|