En cliquant sur "Accepter", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
30 août 2022

Les 10 meilleures pratiques en matière d'annotation des boîtes englobantes

30 août 2022

Les 10 meilleures pratiques en matière d'annotation des boîtes englobantes

Qu'est-ce qu'une boîte englobante ?

Il s'agit d'un rectangle imaginaire qui sert de point de référence pour détecter un objet et qui crée une zone de collision pour cet objet. Il peut être décrit simplement comme un rectangle dessiné autour d'un objet qui indique sa position et définit l'image sous forme de coordonnées X et Y. Ce rectangle entoure l'objet. L'objectif principal d'une boîte englobante est de faciliter l'apprentissage des algorithmes d'apprentissage automatique (MLA), de trouver ce qu'ils recherchent et de préserver d'importantes ressources informatiques. Les boîtes englobantes sont importantes pour l'annotation des images, car elles sont responsables des données d'entraînement et de test pour un modèle censé effectuer une tâche Computer Vision . Sans ces annotations, les machines ne seront pas en mesure de détecter les objets d'intérêt. La boîte englobante est l'une des techniques d'annotation d'images les plus populaires en apprentissage profond. Cette méthode est préférée parce qu'elle est rentable et a une efficacité d'annotation plus élevée par rapport aux autres.

Qu'est-ce que l'augmentation du niveau de la boîte englobante et comment augmente-t-on une boîte englobante ?

Alors que l'augmentation de l'image consiste à accroître la taille de votre ensemble de données en manipulant les données d'entraînement existantes et en aidant un modèle à mieux se généraliser à un large éventail de contextes, une

L'augmentation du niveau des boîtes englobantes crée de nouvelles données d'apprentissage en modifiant uniquement le contenu des boîtes englobantes d'une image source. Les développeurs peuvent ainsi créer des données d'entraînement mieux adaptées aux conditions de leur problème. Le processus d'augmentation des boîtes englobe quatre processus :

1. Importez les bibliothèques requises

2. Définir un pipeline d'augmentation

3. Lire les images et les boîtes englobantes à partir du disque.

4. Transmettre une image et des boîtes de délimitation au pipeline d'augmentation et recevoir des images et des boîtes augmentées.

Cas d'utilisation courants des boîtes englobantes.

Les boîtes englobantes sont utilisées dans divers domaines pour entraîner les algorithmes à identifier des modèles. Voici quelques domaines typiques où les boîtes englobantes sont utilisées :

1. Détection d'objets pour les voitures autonomes

Les données d'apprentissage des boîtes englobantes aident les machines à identifier les objets sur la route ou dans les rues. Ces objets comprennent les feux de signalisation, les autres véhicules, les panneaux de signalisation, les piétons et les voies. Lorsque les données d'entraînement sont extrêmement adaptables, elles aident les machines à mieux reconnaître les obstacles dans les rues et à exécuter des instructions en fonction des informations perçues.

2. Détection d'objets à l'aide de la robotique et de l'imagerie par drone

Les boîtes englobantes peuvent également s'étendre à la reconnaissance d'objets avec la robotique et l'imagerie par drone. Par exemple, les drones peuvent détecter des toits endommagés, des unités de climatisation et la migration d'espèces, s'ils sont associés à des données d'entraînement précises et annotées. Les boîtes englobantes permettent aux robots et aux drones d'identifier facilement des objets physiques à distance.

3. Identification des maladies et de la croissance des plantes en agriculture

Lorsque les maladies des plantes sont identifiées à un stade précoce, les chances de les détecter et de les prévenir à un stade précoce sont accrues. Avec l'avènement de l'agriculture intelligente, l'annotation des boîtes englobantes permet de collecter des données d'entraînement pour former des modèles de détection des maladies des plantes.

4. Détection des dommages pour les réclamations d'assurance

Les boîtes englobantes aident à détecter les dommages pour les réclamations d'assurance. Dans le domaine de l'assurance, les annotations des boîtes englobantes sont utilisées pour former un modèle capable d'identifier immédiatement les incidents ou accidents réguliers. Lorsqu'il y a des dégâts sur la carrosserie, le toit, les feux avant et arrière, les vitres cassées, ces défauts peuvent être identifiés par Computer Vision. Les annotations des boîtes englobantes aident les machines à évaluer l'étendue des dommages afin que les compagnies d'assurance puissent traiter correctement les demandes d'indemnisation.

5. Balisage d'images pour le commerce électronique et la vente au détail

Les annotations des boîtes englobantes permettent de mieux visualiser les produits dans les magasins de détail ou les boutiques en ligne. Ils peuvent reconnaître des objets tels que des produits de soins de la peau, des articles de mode, des meubles, etc. lorsqu'ils sont bien étiquetés. Les annotations des boîtes englobantes peuvent résoudre les problèmes suivants dans le commerce de détail : Les résultats de recherche erronés, le processus de numérisation continu et les chaînes d'approvisionnement organisées de manière chaotique.

Utilisation de l'augmentation du niveau de la boîte englobante

1. Introduire le flou dans les objets

2. Rotation des objets

3. Renverser l'orientation des objets

4. Rendre les objets plus lumineux ou réduire leur luminosité

5. Recadrage des images

Types de boîtes englobantes

1. Sphère environnante (SS)

2. Boîte englobante alignée sur l'axe (AABB)

3. Boîte englobante orientée (OBB)

4. Coque pleine direction (FDH)

5. Coque convexe (CH)

Découvrez les 10 meilleures pratiques en matière d'annotation des boîtes englobantes.

Nos experts vous font part de leurs meilleures pratiques pour obtenir les annotations les plus précises possibles !

Assurer l'intersection au-dessus de l'Union 

L'intersection sur l'union est une technique utilisée sur le site computer vision pour identifier et localiser des objets dans des images ou des vidéos numériques. Les annotations des boîtes englobantes sont utilisées pour atteindre cet objectif par la localisation.  

Éviter les chevauchements excessifs

Lorsqu'il y a un chevauchement excessif entre la boîte de prédiction et la boîte englobante, le modèle est incapable d'identifier l'objet ciblé dans un ensemble de données. Plus le chevauchement est faible, plus la boîte englobante est précise. 

Ne pas commencer par des images diagonales

Dans l'annotation de la boîte englobante, il n'est pas conseillé de commencer par des éléments de forme diagonale. En effet, ils occupent naturellement des espaces plus petits dans la boîte englobante. Le modèle machine peut confondre l'arrière-plan réel avec l'objet ciblé, ce qui va à l'encontre de l'objectif initial de l'annotation. 

Faites attention à la taille

Il est conseillé de se concentrer sur des objets plus petits, car ils ne laissent guère de place aux erreurs. Les images plus grandes sont moins précises lorsqu'elles sont utilisées dans des ensembles de données de boîtes englobantes.

Marquer chaque objet intéressant dans une image 

Chaque objet d'intérêt doit être étiqueté car les modèles d'apprentissage doivent tous les identifier pour obtenir des performances précises. Ce serait une erreur catastrophique d'étiqueter une image et d'en laisser une autre. En effet, les modèles ont été construits de manière à savoir quels motifs de pixels sont conformes à un objet d'intérêt. 

Faire attention à la variation de la taille des boîtes

Les variations de taille des boîtes doivent être cohérentes. Cela est dû au fait que les objets de grande taille sont généralement moins performants dans les ensembles de données, surtout lorsque le même type d'objet semble plus petit. L'entraînement des modèles avec des objets de même taille ne leur permettra pas non plus de fonctionner à la perfection.

Assurer une étanchéité parfaite au pixel près

Pour que les pixels soient parfaitement serrés, les bords de la boîte englobante doivent toucher le plus grand nombre de pixels de l'objet étiqueté. Si des espaces sont laissés, un modèle peut être incapable de donner des prédictions précises.

Marquage des objets occultés

Les objets occultés sont ceux qui ne sont pas visibles parce qu'un obstacle les empêche de l'être. Cela ne justifie pas de le laisser partiellement étiqueté ou complètement non étiqueté. Il doit être annoté tout comme les images entièrement visibles dans la boîte englobante. 

Étiquetage complet et global d'un objet

Un objet d'intérêt doit être étiqueté de manière complète et détaillée, car un étiquetage partiel entraîne une confusion de la part du modèle quant à la nature réelle de l'objet. 

Donner des noms d'étiquetage spécifiques

Il est préférable d'être très spécifique dans l'annotation plutôt que d'être général dans les perspectives. En effet, en cas d'erreur, une étiquette très spécifique peut être ajustée ou ré-annotée. En revanche, si l'étiquetage était général, il sera nécessaire d'étiqueter à nouveau l'ensemble des données pour obtenir la précision requise.

Vous pourriez également aimer
ces autres articles

Vous voulez grandir vos projets de labellisations de données
et le faire de manière éthique ?

Nous disposons d'une large gamme de solutions et d'outils qui vous aideront à former vos algorithmes. Cliquez ci-dessous pour en savoir plus !