En cliquant sur "Accepter", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
11 octobre 2022

Quel est l'objectif du prétraitement des images dans l'apprentissage profond ?

11 octobre 2022

Quel est l'objectif du prétraitement des images dans l'apprentissage profond ?

"Garbage in, garbage out". Ce concept commun à l'informatique et aux mathématiques dans le domaine de l'informatique et de l'apprentissage automatique met en évidence un point très important : même les meilleurs modèles computer vision auront de mauvaises performances si les données d'entrée sont de mauvaise qualité. Il est toujours crucial de travailler à la collecte de données de haute qualité pour la tâche en cours. En outre, même avec des données de haute qualité, le prétraitement permet d'obtenir les meilleurs résultats.

Qu'est-ce que le prétraitement des images ?

Avant d'être utilisées pour l'entraînement et l'inférence de modèles, les images doivent d'abord subir un prétraitement. Cela inclut, mais n'est pas limité à, des ajustements de la taille, de l'orientation et de la couleur. L'objectif du prétraitement est d'améliorer la qualité de l'image afin de pouvoir l'analyser plus efficacement. Le prétraitement nous permet d'éliminer les distorsions indésirables et d'améliorer des qualités spécifiques qui sont essentielles pour l'application sur laquelle nous travaillons. Ces caractéristiques peuvent changer en fonction de l'application. Une image doit être prétraitée pour que le logiciel puisse fonctionner correctement et produire les résultats souhaités.

Pourquoi est-ce important ?

Pour préparer les données d'image à l'entrée du modèle, un prétraitement est nécessaire. Par exemple, les couches entièrement connectées des réseaux neuronaux convolutifs exigent que toutes les images soient dans des tableaux de la même taille.

En outre, le prétraitement du modèle peut réduire le temps d'apprentissage du modèle et accélérer l'inférence du modèle. Si les images d'entrée sont très volumineuses, le fait de réduire la taille de ces images diminuera considérablement le temps nécessaire à l'entraînement du modèle sans affecter de manière significative les performances du modèle. 

Même si les transformations géométriques des images (comme la rotation, la mise à l'échelle et la translation) sont classées parmi les techniques de prétraitement, l'objectif du prétraitement est d'améliorer les données de l'image en supprimant les distorsions involontaires ou en améliorant certaines caractéristiques de l'image cruciales pour le traitement ultérieur.

Quelles étapes de prétraitement doivent être utilisées ? 

1. Orientation :

Lorsqu'une photo est prise, ses métadonnées informent nos ordinateurs de la manière d'afficher l'image en entrée par rapport à la manière dont elle est stockée sur le disque. Son orientation EXIF est le nom donné à ces métadonnées, et la manipulation incorrecte des données EXIF est depuis longtemps une source de frustration pour les développeurs du monde entier. Cela vaut également pour les modèles : si nous avons établi des boîtes de délimitation annotées sur la façon dont nous avons considéré l'orientation d'une image, mais que notre modèle "voit" l'image dans une orientation différente, nous sommes en train de mal former le modèle.

2. Redimensionnez :

Bien que la modification de la taille d'une image puisse sembler simple, il y a des choses à garder à l'esprit. Peu d'appareils capturent des images exactement carrées, bien que de nombreuses topologies de modèles nécessitent des images d'entrée carrées. Il est possible d'étirer les dimensions d'une image pour la rendre carrée ou de conserver le rapport hauteur/largeur de l'image tout en ajoutant des pixels supplémentaires pour remplir le nouvel "espace mort".

3. Flips aléatoires :

Notre modèle doit reconnaître qu'il n'est pas toujours nécessaire de lire un objet de gauche à droite ou de haut en bas en le réfléchissant aléatoirement autour de son axe x ou y. Dans des circonstances dépendant de l'ordre, comme lors du déchiffrage d'un texte, le retournement peut être irrationnel.

4. Niveaux de gris :

Un type de transformation d'image qui peut être appliqué à toutes les images (formation et test) est un changement de couleur. Des changements aléatoires peuvent également être apportés aux images uniquement pendant la formation, en tant qu'augmentations. Chaque image est souvent soumise à une mise à l'échelle des gris, ce qui modifie la couleur. Bien que nous puissions croire que "plus de signal est toujours mieux", nous pouvons en fait observer des performances de modèle plus opportunes lorsque les images sont rendues en niveaux de gris.

5. Exposition différente :

Si l'on peut s'attendre à ce qu'un modèle fonctionne dans diverses conditions d'éclairage, il est plus approprié de modifier la luminosité de l'image pour qu'elle soit plus claire et plus sombre de façon aléatoire. Les niveaux maximum et minimum de luminosité dans l'espace doivent être pris en compte.

Applications réelles du prétraitement des images dans l'apprentissage automatique.

1. L'imagerie médicale: Le traitement d'images peut fournir des images nettes et de haute qualité pour les études scientifiques et médicales, ce qui aide les médecins à établir des diagnostics.

2. Militaire et défense : La stéganographie est une utilisation intrigante du traitement d'images dans la défense. Afin de communiquer des informations dans les deux sens sans qu'un tiers ne remarque le message, les experts peuvent dissimuler un message ou une image à l'intérieur d'une autre image.

3. L'application la plus courante du traitement de l'image est sans doute l'accentuation et la restauration générales des images. L'utilisation de Photoshop ou d'un autre logiciel d'édition d'images pour améliorer et manipuler des photos, ou l'application d'effets créatifs à nos photos sur Snapchat ou Instagram.

Techniques de traitement d'images utilisées dans l'industrie du ML

Afin de transformer les images pour une variété de tâches, telles que l'application de filtres artistiques, l'ajustement d'une image pour une qualité optimale, ou l'amélioration de détails particuliers de l'image pour maximiser la qualité pour les tâches computer vision , de nombreuses techniques avancées de traitement de l'image utilisent des modèles d'apprentissage automatique comme les réseaux neuronaux profonds.

Les réseaux neuronaux convolutifs (CNN) apprennent à effectuer des tâches telles que la détection d'objets, la segmentation d'images et la classification en prenant une image d'entrée et en lui appliquant des filtres.

Les progrès récents de l'apprentissage automatique permettent aux ingénieurs d'améliorer les données d'image en plus de les modifier. 

Conclusion 

Les opérations sur les images au niveau d'abstraction le plus élémentaire sont appelées prétraitement des images. Si l'on utilise l'entropie comme mesure de l'information, ces processus réduisent en fait la quantité d'information présente dans l'image. Le prétraitement vise à améliorer les données de l'image en renforçant certaines caractéristiques de l'image qui sont importantes pour les tâches de traitement et d'analyse ultérieures ou en supprimant les distorsions indésirables.

Vous pourriez également aimer
ces autres articles

Vous voulez faire grandir vos projets de labellisation de données
et le faire de manière éthique ?

Nous disposons d'une large gamme de solutions et d'outils qui vous aideront à former vos algorithmes. Cliquez ci-dessous pour en savoir plus !