Je suis en train de refondre un petit outil interne pour mon équipe et je me retrouve avec deux jeux de données très similaires, mais pas tout à fait identiques. Historiquement, ils ont été gérés dans des feuilles de calcul séparées et ça devient ingérable. Je pense qu'il est temps de tout centraliser dans une base de données relationnelle, mais je me demande si je vais créer plus de problèmes que j'en résous en fusionnant ces sources. D'un côté, ça simplifierait tout, de l'autre, j'ai peur de perdre des nuances ou de devoir tout retravailler pour que ça colle. Quelqu'un a-t-il déjà été dans cette situation ?
|
Comment savoir si fusionner deux jeux de données en base relationnelle est utile ?
|
|
Oui, j’ai déjà fait ça: deux jeux de données très proches, on passe par une base relationnelle et soudain tout devient plus clair pour les rapports. La fusion simplifie les requêtes et la traçabilité, mais on se retrouve à harmoniser des définitions, à décider quelles colonnes garder et quelles règles métier normaliser. Ça peut gagner du temps à long terme, mais ce n’est pas magique.
J’étais plutôt enthousiaste à l’idée de centraliser, puis j’ai trinqué avec le mapping des champs et la migration des règles métiers. On gagne en cohérence et en traçabilité, mais l’adoption et les migrations peuvent prendre plus de temps que prévu. La fusion a du sens si on garde des sauvegardes claires et une stratégie de versionnage.
Pour éviter les dégâts, je commencerais par cartographier les entités, les attributs et les dépendances, puis comparer normalisation vs dénormalisation. Test sur un sous-ensemble, définir les clés primaires et les contraintes, et mesurer l’impact sur les règles métier et les rapports. La fusion peut être bénéfique mais il faut un plan clair.
J’ai cru comprendre que tu parlais de copier-coller les feuilles, mais en vrai c’est surtout le modèle à repenser: quelles entités, quelles relations, et quelles valeurs tiennent le plus pour l’équipe. Si on ne refond pas le modèle, la fusion risque de rester superficielle.
Et si ce n’était pas nécessaire? Une supercouche autour des feuilles existantes, via une API ou des vues, peut suffire pour des usages internes sans bouleverser les données. La fusion peut être overkill selon les cas, et ça peut même augmenter la complexité des accès. Peut-être tester avec un prototype rapide.
En fait, ce n’est pas tant fusionner ou non que comment les données vont soutenir les cas d’usage demain; commence par un catalogue des cas d’usage et des règles, puis décide si une modélisation relationnelle répond vraiment. La fusion peut s’inscrire dans une démarche progressive.
|
|
« Sujet précédent | Sujet suivant »
|

