Salut à tous, je me pose une question depuis que j’ai changé de poste. Avant, je travaillais sur des rapports assez basiques, et maintenant on me demande de mettre en place un pipeline de données complet pour une nouvelle application. Le truc, c’est que je passe tellement de temps à construire et à maintenir l’infrastructure ETL que j’ai l’impression de ne plus vraiment toucher aux données elles-mêmes, ni de vraiment comprendre ce qu’elles racontent au final. Certains d’entre vous ont-ils déjà eu ce sentiment de devenir plus "ingénieur" qu’"analyste" ? Ça me fait un peu douter sur la suite.
|
Comment rester proche des données en passant d'analyste à ingénieur data?
|
|
Je connais ce point de vue. Tu te retrouves à devenir un ingénieur d’infrastructure et moins un analyste, et le pipeline de données prend tout l’espace. On passe des heures à configurer des jobs et à faire tourner des DAG quand ce qui t’intéresse vraiment, c’est ce que disent les chiffres. Pour contrer ça, bloque des créneaux d’exploration des données et commence chaque semaine par une session courte sans toucher au code pour regarder ce que racontent vraiment les données.
Ça me serre le cœur pour toi, mais t’es pas seul.e. ce sentiment, c’est aussi le signe que tu apprends des choses utiles sur comment les données servent le business.
Est-ce que ce pipeline ne donne pas en fait plus de visibilité sur les limites des données que sur leur sens ?
Le vrai enjeu est l’usage des insights plutôt que la construction des flux. Reformuler le souci il s’agit de faire parler les données sans que le métier devienne esclave de la technique.
Hmm, j’ai vécu ça aussi. Parfois on n’a pas le temps de toucher aux chiffres et on crucialise sur les pipelines.
On parle aussi des attentes des lecteurs et des habitudes de travail et le passage analyste à ingénieur peut être vu comme une répartition des rôles et il est légitime de se demander ce que signifie vraiment comprendre les données.
|
|
« Sujet précédent | Sujet suivant »
|

