Salut à tous, je suis un peu perdu avec un truc sur mon projet de master. Je bosse sur l'analyse de données de séquençage, et mon superviseur m'a suggéré d'utiliser un modèle d'apprentissage automatique pour catégoriser certaines séquences. Le truc, c'est que j'ai passé des semaines à nettoyer et préparer mes données à la main, avec une méthode très traditionnelle, et je me demande maintenant si tout ce travail minutieux n'est pas un peu obsolète face à ce que peut faire l'intelligence artificielle en science. J'ai l'impression d'avoir peut-être perdu du temps, ou au contraire d'avoir posé des bases indispensables que le modèle ne pourrait pas comprendre sans ça. Quelqu'un a déjà eu ce sentiment de doute en introduisant ces outils dans un processus établi ?
|
Comment savoir si le nettoyage des données est encore utile face à l’IA?
|
|
Franchement le prétraitement des données reste central pour moi même si l IA promet beaucoup et peut corriger des bruits. Sans ça le modèle risque d'apprendre des signaux artefacts.
Pour moi le prétraitement des données agit comme une garantie de qualité, il fixe les formes des données et limite les fuites d information entre apprentissage et test.
On peut se demander si l IA peut tout faire en partant d un protocole tout fait et si le prétraitement n est qu une impression de progrès.
Le problème n est pas de savoir si l IA est magique mais comment tu définis l objectif et les métriques pour évaluer le prétraitement.
Parfois j ai l impression que les lecteurs attendent le style plus que les chiffres et le prétraitement devient alors une histoire de lisibilité.
Et si le vrai saut c est d intégrer le prétraitement comme une étape dynamique avec le modèle et pas de tout automatiser.
|
|
« Sujet précédent | Sujet suivant »
|

