En cliquant sur "Accepter", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
3 mai 2022

Comment gérer les annotations d'images manquantes ou nulles ?

3 mai 2022

Explication de l'annotation des données pour l'apprentissage automatique

L'annotation des données dans l'apprentissage automatique implique annotation les données pour représenter les résultats que vous voulez que votre modèle d'apprentissage automatique analyse. Elle comprend annotation, le marquage, annotation et la transcription d'ensembles de données ML avec les attributs que vous voulez que votre système d'apprentissage automatique commence à apprendre à reconnaître.

Quels sont les défis des annotations d'images ? 

Qu'il s'agisse d'identifier les objets ou de s'assurer qu'ils sont reconnaissables pour les modèles ML basés sur computer vision, l'annotation d'une image peut poser un certain nombre de problèmes. En voyant comment chaque objet doit être annoté avec des cuboïdes, des boîtes de délimitation, des lignes ou d'autres méthodes d'annotation requises par les besoins du client, l'obtention du contexte réel d'une scène pour la reconnaissance d'objets peut être un travail difficile. Voici quelques-uns de ces défis.

1. Imprécision des données annotées :

Il peut être très difficile pour les humains d'annoter un ensemble de données avec précision et sans erreur, en particulier lorsqu'il s'agit d'étiqueter les caractéristiques d'une image, car il est généralement difficile d'identifier toutes les propriétés utiles d'une image qui peuvent être utilisées pour la décrire correctement. En effet, il est généralement difficile d'identifier toutes les propriétés utiles d'une image qui peuvent être utilisées pour la décrire correctement, ce qui peut empêcher l'intelligence artificielle de traiter ce qui est étiqueté ou de l'interpréter, réduisant ainsi l'efficacité. L'exactitude et la pertinence de annotation de données est un processus qui demande beaucoup de travail, en particulier lorsqu'il s'agit de gros volumes de données non structurées.

2. Des résultats biaisés :

Le jugement humain est imparfait et biaisé, ce qui pourrait créer un problème lorsqu'ils effectuent des tâches d'annotation, car ils pourraient ajouter leurs propres préjugés personnels lors de la définition des annotations pour les ensembles de données.

3. Cela prend du temps :

Si votre projet est de grande envergure, l'annotation des images peut vous prendre des semaines. Cela inclut le temps et les efforts nécessaires à la création de l'annotation instructions et à la formation des annotateurs humains, ce qui pourrait affecter, voire retarder, le calendrier du projet.

Types d'erreurs d'annotation

1. Classe incorrecte : Lorsqu'un objet est classé de manière incorrecte, par exemple une maison annotée comme un bus.

2. Annotation manquante : Lorsqu'une annotation d'objet est omise là où elle devrait exister. 

3. Annotation redondante : Lorsque l'annotation est faite pour un objet qui n'en a pas besoin.

4. Attribut incorrect : Lorsque la position d'un objet n'est pas décrite correctement, par exemple lorsqu'un piéton qui marche est annoté comme étant debout.

5. Taille d'annotation incorrecte : Lorsque l'annotation d'un objet est différente de ses dimensions réelles.

La différence entre les annotations manquantes et nulles

Dans la plupart des tableaux de résultats, les valeurs nulles sont interprétées comme des valeurs inconnues et les valeurs manquantes comme des valeurs connues. Une valeur nulle est un marqueur spécial généralement utilisé dans un ensemble de données pour indiquer qu'une valeur de données n'existe pas dans la base de données. En termes simples, elle est utilisée pour désigner des valeurs que nous ne connaissons pas, tandis que les valeurs manquantes se produisent lorsqu'aucune valeur de données n'est stockée pour les variables ou les participants observés. Il peut s'agir d'une seule valeur manquante dans une cellule ou d'une ligne entière. Elles font partie des erreurs les plus courantes rencontrées dans l'annotation des données.

Comment gérer les annotations manquantes et nulles

1. Supprimer les lignes contenant des valeurs manquantes : Les valeurs manquantes peuvent être traitées en supprimant les lignes ou les colonnes ayant des valeurs nulles. Si des colonnes ont plus de la moitié de lignes nulles, la colonne entière peut être supprimée, même si cette méthode peut entraîner la perte de nombreuses informations et ne fonctionne pas très bien si le pourcentage de valeurs manquantes représente une grande partie de l'ensemble des données.

2. Utilisation d'algorithmes prenant en charge les valeurs manquantes : La plupart des modèles d'apprentissage ML actuels ne prennent pas en charge les valeurs manquantes, mais certains modèles ML, comme l'algorithme k-NN, sont suffisamment polyvalents pour ignorer les valeurs manquantes dans l'ensemble de données. D'autres, comme Naive Bayes, peuvent également prendre en compte les valeurs manquantes lors de l'élaboration d'une prévision.

3. Introduisez les valeurs manquantes avec Moyenne/Médiane : Ici, les valeurs manquantes sont remplacées par les valeurs moyennes ou médianes. Cette méthode permet d'éviter la perte de données qui est inévitable avec la plupart des autres méthodes. Remplacer les deux approximations ci-dessus (moyenne, médiane) est une approche statistique pour traiter les valeurs manquantes.

La plupart des ensembles de données comportent des valeurs manquantes ou nulles que vous devez traiter intelligemment si vous voulez créer un modèle d'IA précis et polyvalent, capable de répondre aux besoins de votre entreprise.

Vous pourriez également aimer
ces autres articles

Vous voulez faire grandir vos projets de labellisation de données
et le faire de manière éthique ?

Nous disposons d'une large gamme de solutions et d'outils qui vous aideront à former vos algorithmes. Cliquez ci-dessous pour en savoir plus !