Salut à tous, je me tourne vers vous parce que je suis un peu perdu sur un truc au boulot. J’ai récemment mis en place un pipeline pour automatiser des rapports, et dans l’ensemble ça marche, mais je me retrouve avec des écarts inexplicables entre les chiffres de mon lac de données et ceux du système source quand je fais des vérifications ponctuelles. C’est assez frustrant parce que tout semble correct dans le code, et pourtant, parfois, les totaux ne collent pas. Je me demande si c’est un problème de temporalité dans l’ingestion, ou si je rate quelque chose d’évident sur la qualité des données en amont. Des gens ont-ils déjà eu ce genre de mauvaises surprises après avoir cru leur processus rodé ?
|
Comment corriger les écarts entre le lac de données et la source?
|
|
« Sujet précédent | Sujet suivant »
|

