đŸ‘ïžâ€đŸ—šïž Coup d’oeil sur le Test-Time Augmentation

Utiliser la data augmentation au moment de l’infĂ©rence pour faire de meilleures prĂ©dictions.

Mlamali Said Salimo
Wanabilini
3 min readJan 26, 2024

--

La plupart des gens considĂšrent la data augmentation comme une technique qui consiste Ă  crĂ©er des variations dans les donnĂ©es d’entrainement, dans le but pour amĂ©liorer les performances d’un modĂšle et le rendre plus rĂ©sistant aux variations.

C’est totalement vrai.

🌟 Mais, est-ce que vous saviez qu’il existe une autre utilisation de cette technique pour amĂ©liorer la prĂ©cision des prĂ©dictions de votre modĂšle ?

Imaginez que vous construisez un modĂšle de classification multi-classes.

Lors de son dĂ©ploiement, chaque input (requĂȘte / image dans cette exemple) est traitĂ©e par le modĂšle pour dĂ©terminer la classe correcte associĂ©e Ă  l’image. Vous utilisez une seule photo pour faire une prĂ©diction, votre modĂšle a donc une seule chance, une seule opportunitĂ© pour trouver la bonne rĂ©ponse.

🚀 Il existe un truc pour amĂ©liorer vos rĂ©sultats, c’est Ă  dire ici, la prĂ©cision et la fiabilitĂ© des prĂ©dictions du modĂšle.

Une Augmentation oui, mais au moment du test

La Test-Time Augmentation (ou l’augmentation au moment du test) est une technique dans laquelle vous pouvez augmenter des Ă©chantillons avant de les faire passer Ă  travers le modĂšle, puis vous moyennez les rĂ©sultats des prĂ©dictions.

Par exemple, au lieu de faire passer une image Ă  travers le modĂšle, vous pouvez gĂ©nĂ©rer deux versions supplĂ©mentaires en augmentant l’image originale. Par exemple, vous pouvez lĂ©gĂšrement faire pivoter l’image et la recadrer un peu, la retourner, ou encore varier l’ajustement des contrastes ou des couleurs.

Vous avez maintenant trois images différentes pour faire une prédiction. Faites-les passer à travers le modÚle, moyennez les trois vecteurs softmax que vous obtenez en retour, et déterminez la classe finale à partir du résultat.

Schéma illustratif de la Test-Time Augmentation dans un contexte de classification de félins. Plusieurs tigre

En augmentant l’image originale, vous donnez au modĂšle plus d’opportunitĂ©s de voir quelque chose de diffĂ©rent et de calculer la bonne prĂ©diction.

Vous pouvez tirer parti de la data augmentation pour vous donner une meilleure chance de faire la bonne prédiction.

Faire de bonnes augmentations

Le succĂšs de la Test-Time Augmentation dĂ©pend de la qualitĂ© de vos Ă©chantillons augmentĂ©s ; c’est donc dans cela que toute votre attention devra ĂȘtre consacrĂ©.

Vos Ă©chantillons augmentĂ©s auront beaucoup d’influence sur le rĂ©sultat final. Si vous crĂ©ez des variations bĂąclĂ©es de l’image originale, l’augmentation au moment du test peut rapidement diminuer la performance de votre modĂšle dans la prĂ©diction.

Commencez avec de lĂ©gĂšres modifications de l’image initiale. Ne vous emballez pas. Vous constaterez que la plupart du succĂšs repose sur l’évitement d’une complexitĂ© excessive.

Conclusion

Traditionnellement, la data augmentation n’est pas recommandĂ©e sur les jeux de donnĂ©es de test car cela pourrait fausser l’évaluation du modĂšle, le rendant moins capable de gĂ©nĂ©raliser Ă  des donnĂ©es non modifiĂ©es. Tout cela, fait que dans notre esprit, vous et moi avions toujours eu ce schĂ©ma en tĂȘte : TEST + DATA AUGMENTATION = ATTENTION, JAMAIS.

Nous venons de voir que la Test-Time Augmentation est diffĂ©rente. Elle n’est pas utilisĂ©e pour Ă©valuer le modĂšle, mais pour amĂ©liorer ses prĂ©dictions au moment de l’infĂ©rence


Je rĂ©pĂšte et prĂ©cise : la Test-Time Augmentation est diffĂ©rente. Elle est lĂ  pour optimiser la prĂ©cision des rĂ©sultats du modĂšle lorsqu’il est confrontĂ© Ă  des donnĂ©es rĂ©elles et inconnu (phase test)
 elle n’est pas utilisĂ© pour renforcer de la capacitĂ© gĂ©nĂ©rale du modĂšle Ă  apprendre et Ă  gĂ©nĂ©raliser (phase entrainement).

💡 C’est une maniĂšre intelligente d’exploiter la flexibilitĂ© de la data augmentation pour optimiser les performances du modĂšle en pratique, sans compromettre son aptitude Ă  gĂ©nĂ©raliser sur de nouvelles donnĂ©es.

--

--

Mlamali Said Salimo
Wanabilini
Editor for

Student + Machine Learning & Artificial intelligence Enthusiast. Contact me at mlamali.saidsalimo [at] gmail.com