Les 4 principaux types d'annotation d'images en 2023
L'annotation d'images, dans le cadre de l'apprentissage automatique ou de l'apprentissage profond, est le processus par lequel les images sont annotées ou classées à l'aide de texte ou d'outils d'annotation, ou des deux, permettant à un système d'intelligence artificielle (un robot, une machine ou un système automatisé, etc.) de reconnaître par lui-même les caractéristiques des données. Annoter une image, c'est ajouter des métadonnées à un ensemble de données.
On parle aussi parfois de annotation, de transcription ou de traitement. En effet, il est possible d'annoter des vidéos en continu, par flux ou image par image.
L'annotation des images permet à votre système d'apprentissage automatique de reconnaître les éléments marqués que vous souhaitez qu'il reconnaisse. Les images peuvent être utilisées pour l'apprentissage supervisé de votre système. Une fois votre système formé, il sera capable de prendre une décision ou d'entreprendre une action en fonction de sa capacité à identifier des caractéristiques dans les images annotées.
L'annotation d'images est le plus souvent utilisée pour reconnaître des objets, des limites et pour segmenter des images afin d'en comprendre le contenu, le sens ou l'image entière. Pour chacune de ces utilisations, une quantité importante de données est nécessaire pour entraîner, valider et tester un modèle d'apprentissage automatique afin d'obtenir le résultat souhaité. L'annotation d'images peut être simple lorsqu'il s'agit simplement de classer l'image en fonction de sa description (par exemple, nous avons une image d'un chat dans un salon, nous pouvons annoter l'image du chat avec le annoter "chat domestique"). Elle peut également s'avérer complexe lorsqu'il s'agit de distinguer différents éléments ou zones de l'image à annoter (par exemple : nous devons apprendre à notre machine à reconnaître la différence entre un chat siamois et un chat persan).
Il existe 4 principaux types d'annotation d'images :
La classification est un type d'annotation d'images qui consiste à identifier la présence d'objets similaires représentés dans les images d'un ensemble de données. Ce type d'annotation est utilisé pour entraîner une machine à reconnaître un objet dans une image non annotée, qui ressemble à un objet dans d'autres images déjà annotées, déjà utilisées pour entraîner la machine.
Par exemple : un annotateur peut annotater des images d'intérieur avec les labels suivants en fonction de leur type : cuisine, salon, etc. Il peut également annotater des images d'extérieur en déterminant s'il fait "jour" ou "nuit".
La détection d'objets est une forme d'annotation qui consiste à identifier la présence, la position et le nombre d'un ou plusieurs objets dans une image et à les annoter de la manière la plus précise possible. Il est possible d'annoter les objets d'une image à l'aide de techniques telles que l'annotation par polygone ou par boîte englobante. Par exemple, nous pouvons avoir plusieurs images de scènes de rue dans lesquelles nous voulons identifier des camions, des piétons, des vélos ou des voitures. Il est possible de les annoter séparément sur la même image grâce à la détection d'objets.
La segmentation sémantique est une application plus avancée de l'annotation d'images. Elle est utilisée de plusieurs façons pour analyser le contenu visuel des images et déterminer en quoi les objets d'une image sont différents ou identiques. Cette méthode est utilisée lorsque nous voulons comprendre la présence, l'emplacement et parfois la taille et/ou la forme des objets dans les images.
Par exemple : nous avons plusieurs images comprenant une foule et un stade sur lesquels nous voulons annoter, il est possible d'annoter la foule pour segmenter les sièges du stade.
La segmentation d'images par apprentissage profond permet de suivre et de compter la présence, la position, le nombre, la taille et la forme des objets dans une image. En reprenant l'exemple précédent du stade et de la foule, il est possible d'annoter à la fois les individus présents dans le stade et de déterminer le nombre de personnes dans la foule en utilisant ce type d'annotation et en utilisant la segmentation par pixel.
L'annotation d'images peut également être utilisée pour entraîner des machines à reconnaître les limites ou les lignes des objets (ce que l'on appelle la "reconnaissance des limites") dans une image. Ces limites peuvent inclure les bords d'un objet individuel ou la zone de topographie affichée dans l'image. Ce type d'annotation est utilisé dans l'apprentissage des voitures autonomes. Il est utilisé pour reconnaître les limites des trottoirs, par exemple, ou des voies de circulation, etc.
Elle peut également être utilisée pour former des modèles d'apprentissage automatique pour les drones, lorsqu'il est important de suivre une trajectoire particulière ou de reconnaître des obstacles potentiels tels que des lignes électriques, par exemple.
La médecine et le commerce de détail utilisent également ce type d'annotation pour améliorer leurs systèmes d'apprentissage automatique : par exemple, pour l'annotation d'images médicales où nous devons reconnaître les différentes cellules, ou les différentes allées d'un magasin où nous pouvons nous concentrer sur les allées les plus fréquentées et exclure les autres allées qui ne correspondent pas à ce que nous voulons annoter.
Pour annoter vos images, plusieurs outils d'annotation de données existent. Certains outils sont payants, d'autres sont disponibles en open source ou en freeware. Vous cherchez un partenaire pour vous aider à annoter vos images ? Isahit dispose de son propre outil d'annotation innovant au sein de sa plateforme numérique socialement responsable et d'une communauté de contributeurs compétents, répartis sur 4 continents, prêts à vous aider.
ℹ️ Demandez une démonstration d'annotation d'image et parlons de votre projet.
Pour en savoir plus sur nos services d'annotation, consultez nos solutions pour computer vision.
Nous disposons d'une large gamme de solutions et d'outils qui vous aideront à former vos algorithmes. Cliquez ci-dessous pour en savoir plus !