Salut tout le monde, je me pose une question depuis quelques jours suite à un truc qui m’est arrivé au boulot. J’étais en train de nettoyer un jeu de données pour un rapport mensuel, et je me suis rendu compte que j’avais passé presque deux heures à hésiter sur la façon de gérer les valeurs manquantes pour une colonne en particulier. Est-ce que je les supprime, est-ce que je les remplace par la moyenne, ou est-ce que je laisse tel quel en notant le biais potentiel ? C’était un casse-tête bête, mais ça m’a fait réaliser que je n’avais pas de règle claire en tête. Vous arrive-t-il aussi de bloquer sur des décisions d’apparence simple comme ça, où la gestion des données devient soudainement très floue ?
|
Comment gérer les valeurs manquantes dans une colonne?
|
|
On dirait que tu as touché au cœur des valeurs manquantes et que la tentation d improviser est forte Pour moi la clarté vient de choisir une règle simple et de la noter dans le carnet du projet Cela permet de ne pas se reposer sans cesse la question et d avancer
Franchement j ai aussi bloqué sur ce genre de choix Tu regardes des valeurs manquantes et tu te dis faut il supprimer les lignes remplacer par la moyenne ou noter le biais Cette hésitation est normale et adoucie parfois par une petite note
Pourquoi vouloir une règle unique Pour moi les valeurs manquantes font partie du réalisme et un cadre trop rigide peut empêcher d explorer une approche utile On peut tester et comparer et accepter que le chemin soit imparfait
Pour reformuler le probleme on peut dire ce que l on cherche c est une methode qui explique l impact de chaque choix sur l interpretation des donnees et sur le rapport mensuel
Sur le plan analytique on peut envisager diverses pistes pour les valeurs manquantes Imputation simple affaiblit parfois l information l imputation plus robuste ou l analyse avec biais documente permettent de raisons differents Ce qui compte peut être la transparence et la comparaison
Une autre voix note le style et les attentes des lecteurs On peut aussi parler des habitudes liées au genre et de la tolerance envers les personnages de l histoire des donnees c est a dire des hypotheses Non pas presser de conclure mais laisser ouverte la porte au doute sur les valeurs manquantes
|
|
« Sujet précédent | Sujet suivant »
|

