👁️‍🗨️ Coup d’oeil sur le Test-Time Augmentation

Utiliser la data augmentation au moment de l’inférence pour faire de meilleures prédictions.

Published in

Wanabilini

3 min readJan 26, 2024

La plupart des gens considèrent la data augmentation comme une technique qui consiste à créer des variations dans les données d’entrainement, dans le but pour améliorer les performances d’un modèle et le rendre plus résistant aux variations.

C’est totalement vrai.

🌟 Mais, est-ce que vous saviez qu’il existe une autre utilisation de cette technique pour améliorer la précision des prédictions de votre modèle ?

Imaginez que vous construisez un modèle de classification multi-classes.

Lors de son déploiement, chaque input (requête / image dans cette exemple) est traitée par le modèle pour déterminer la classe correcte associée à l’image. Vous utilisez une seule photo pour faire une prédiction, votre modèle a donc une seule chance, une seule opportunité pour trouver la bonne réponse.

🚀 Il existe un truc pour améliorer vos résultats, c’est à dire ici, la précision et la fiabilité des prédictions du modèle.

Une Augmentation oui, mais au moment du test

La Test-Time Augmentation (ou l’augmentation au moment du test) est une technique dans laquelle vous pouvez augmenter des échantillons avant de les faire passer à travers le modèle, puis vous moyennez les résultats des prédictions.

Par exemple, au lieu de faire passer une image à travers le modèle, vous pouvez générer deux versions supplémentaires en augmentant l’image originale. Par exemple, vous pouvez légèrement faire pivoter l’image et la recadrer un peu, la retourner, ou encore varier l’ajustement des contrastes ou des couleurs.

Vous avez maintenant trois images différentes pour faire une prédiction. Faites-les passer à travers le modèle, moyennez les trois vecteurs softmax que vous obtenez en retour, et déterminez la classe finale à partir du résultat.

Schéma illustratif de la Test-Time Augmentation dans un contexte de classification de félins. Plusieurs tigre

En augmentant l’image originale, vous donnez au modèle plus d’opportunités de voir quelque chose de différent et de calculer la bonne prédiction.

Vous pouvez tirer parti de la data augmentation pour vous donner une meilleure chance de faire la bonne prédiction.

Faire de bonnes augmentations

Le succès de la Test-Time Augmentation dépend de la qualité de vos échantillons augmentés ; c’est donc dans cela que toute votre attention devra être consacré.

Vos échantillons augmentés auront beaucoup d’influence sur le résultat final. Si vous créez des variations bâclées de l’image originale, l’augmentation au moment du test peut rapidement diminuer la performance de votre modèle dans la prédiction.

Commencez avec de légères modifications de l’image initiale. Ne vous emballez pas. Vous constaterez que la plupart du succès repose sur l’évitement d’une complexité excessive.

Conclusion

Traditionnellement, la data augmentation n’est pas recommandée sur les jeux de données de test car cela pourrait fausser l’évaluation du modèle, le rendant moins capable de généraliser à des données non modifiées. Tout cela, fait que dans notre esprit, vous et moi avions toujours eu ce schéma en tête : TEST + DATA AUGMENTATION = ATTENTION, JAMAIS.

Nous venons de voir que la Test-Time Augmentation est différente. Elle n’est pas utilisée pour évaluer le modèle, mais pour améliorer ses prédictions au moment de l’inférence…

Je répète et précise : la Test-Time Augmentation est différente. Elle est là pour optimiser la précision des résultats du modèle lorsqu’il est confronté à des données réelles et inconnu (phase test)… elle n’est pas utilisé pour renforcer de la capacité générale du modèle à apprendre et à généraliser (phase entrainement).

💡 C’est une manière intelligente d’exploiter la flexibilité de la data augmentation pour optimiser les performances du modèle en pratique, sans compromettre son aptitude à généraliser sur de nouvelles données.

Vous avez aimé ? Restons connecté

Abonnez-vous gratuitement à mon Medium pour être averti lorsque je publie un nouvel article, une nouvelle histoire.

Get an email whenever Mlamali Said Salimo 👩🏾‍💻 publishes.

Get an email whenever Mlamali Said Salimo 👩🏾‍💻 publishes. By signing up, you will create a Medium account if you…

medium.com

Retrouver moi sur LinkedIn, et Github.