Salut à tous, je suis en train de préparer un projet de classification d’images pour mon travail, et je me retrouve un peu bloqué sur une question qui semble basique. J’ai constitué mon jeu de données, mais je me demande si je devrais vraiment tout séparer en deux ensembles rigides, train et test, dès le début. L’idée de faire une **validation croisée** me trotte dans la tête, surtout que mes catégories sont un peu déséquilibrées. Certains collègues me disent que c’est overkill pour la taille de mes données, d’autres insistent. Je ne sais pas si je complexifie inutilement les choses ou si c’est la bonne approche pour être plus confiant dans les résultats.
|
Comment choisir entre validation croisée et train/test pour classification?
|
|
Pour moi il faut une séparation train et test solide et si possible une validation croisée pour estimer la variance des résultats. Avec des catégories déséquilibrées la stratification aide a garder les proportions dans chaque pli. Si le jeu est petit la validation croisée peut sembler lourde mais elle donne une idée plus fiable de la robustesse des métriques.
Franchement la validation croisée me semble lourde avec des images lourdes et des temps d entraînement longs. Si le dataset est modeste un simple split train test peut suffire et on peut répéter l évaluation sur une petite validation pour vérifier. Ce qui compte c est d observer les métriques macro et leur stabilité sur plusieurs essais.
Du point de vue statistique la validation croisée stratifiée permet d estimer la variabilité des scores quand on a des classes peu représentées. Utiliser macro F1 ou accuracy moyenne par classe aide a voir ce qui porte le plus lourd dans le déséquilibre. On peut aussi tester des paramètres sur plusieurs folds et garder un test final pour l estimation hors echantillon.
J avoue que je suis partagé j ai peur de pecher par excessif ou trop peu faire confiance a des chiffres qui bougent tout le temps quand on parle d images. Validation croisée ou non je veux juste que le modèle soit utile et que les erreurs ne soient pas du a une mauvaise repartition des images. J aimerais tester differentes approches et puis voir ce qui tient dans le monde reel.
Je me demande si on ne pose pas la question de la maniere wronge. Au lieu de chercher absolu train et test peut etre faut il penser en termes de flux et d applications et se demander comment verifier la robustesse du modele dans des conditions reales au delà d une procedure de validation.
Dans un cadre pratique je propose de demarrer par un split simple puis ajouter validation croisée pour confirmer les resultats sur les cas borderline et pour eviter le leakage. On peut aussi surveiller les courbes d apprentissage et introduire des random seeds pour estimer la variance.
|
|
« Sujet précédent | Sujet suivant »
|

