Comment corriger les écarts entre le lac de données et la source?
#1
Salut à tous, je me tourne vers vous parce que je suis un peu perdu sur un truc au boulot. J’ai récemment mis en place un pipeline pour automatiser des rapports, et dans l’ensemble ça marche, mais je me retrouve avec des écarts inexplicables entre les chiffres de mon lac de données et ceux du système source quand je fais des vérifications ponctuelles. C’est assez frustrant parce que tout semble correct dans le code, et pourtant, parfois, les totaux ne collent pas. Je me demande si c’est un problème de temporalité dans l’ingestion, ou si je rate quelque chose d’évident sur la qualité des données en amont. Des gens ont-ils déjà eu ce genre de mauvaises surprises après avoir cru leur processus rodé ?
Répondre


[-]
Réponse rapide
Message
Saisissez votre réponse à ce message ici.

Code de confirmation
Veuillez saisir le texte figurant dans l’image ci-dessous. Ce procédé permet de bloquer les robots.
Code de confirmation
(insensible à la casse)

Aller au forum