Comment traiter des données bruitées pour prédire le rendement des tomates ?
#1
Salut à tous, je me tourne vers vous parce que je suis un peu perdu sur un point précis de mon projet perso. J’ai collecté des données de capteurs sur mon potager (humidité, température, ensoleillement) pendant un an, et j’aimerais voir si je peux prédire le rendement de mes tomates l’an prochain. Le truc, c’est que mes séries temporelles sont assez bruitées avec des trous, et je me demande si je dois vraiment me lancer dans une modélisation complexe ou si une approche plus simple avec une bonne **préparation des données** suffirait pour avoir une tendance à peu près fiable. J’ai l’impression de passer plus de temps à nettoyer qu’à analyser, et ça me décourage un peu.
Répondre
#2
Tu es sur le bon chemin même avec des trous: une bonne préparation des données peut te donner une tendance sans te lancer dans un modèle trop lourd. Commence par imputer les trous (interpolation simple ou imputation moyenne), puis repère les saisons et les cycles. Crée des features simples: moyennes hebdomadaires, écarts types sur des blocs de 2 à 4 semaines, et des lags des capteurs. Normalise et regarde si une approche simple comme une régression linéaire peut capter une partie du signal sans surapprentissage. Si le bruit écrase le signal, tu peux tester des modèles plus robustes comme Random Forest ou Gradient Boosting, mais l’idée centrale reste que la préparation des données peut déjà te donner une tendance, sans que tu aies à tout reconstruire sur le temps et l’effort investi.
Répondre
#3
Franchement, on dirait que tu te bats avec le temps passé à nettoyer plutôt qu’à analyser. Si la préparation des données devient le vrai goulot d’étranglement, teste une approche ultra-simple: consolide les données en moyennes mensuelles et regarde les corrélations avec le rendement estimé. Un petit modèle linéaire sur ces agrégats peut t’offrir une intuition sans te faire courir après chaque artefact. Le reste peut attendre; l’objectif est d’obtenir quelque chose de stable sans y passer des semaines.
Répondre
#4
Et si on reformulait carrément le problème: plutôt que de viser un rendement exact, est-ce que l’objectif réel est d’obtenir des signaux ou des probabilités qui indiquent quand la tomate sera abondante? Cela pourrait rendre l’outil utile même avec un peu de bruit. Peut-être que certains facteurs non mesurés comptent autant que les capteurs: irrigation, sol, variété, ou microclimat dans le potager. La clé reste la préparation des données, mais on peut aussi accepter une incertitude et utiliser une prédiction probabiliste plutôt qu’une valeur unique.
Répondre


[-]
Réponse rapide
Message
Saisissez votre réponse à ce message ici.

Code de confirmation
Veuillez saisir le texte figurant dans l’image ci-dessous. Ce procédé permet de bloquer les robots.
Code de confirmation
(insensible à la casse)

Aller au forum