Les 10 meilleures pratiques en matière d'annotation des boîtes englobantes
Il s'agit d'un rectangle imaginaire qui sert de point de référence pour détecter un objet et qui crée une zone de collision pour cet objet. Il peut être décrit simplement comme un rectangle dessiné autour d'un objet qui indique sa position et définit l'image sous forme de coordonnées X et Y. Ce rectangle entoure l'objet. L'objectif principal d'une boîte englobante est de faciliter l'apprentissage des algorithmes d'apprentissage automatique (MLA), de trouver ce qu'ils recherchent et de préserver d'importantes ressources informatiques. Les boîtes englobantes sont importantes pour l'annotation des images, car elles sont responsables des données d'entraînement et de test pour un modèle censé effectuer une tâche Computer Vision . Sans ces annotations, les machines ne seront pas en mesure de détecter les objets d'intérêt. La boîte englobante est l'une des techniques d'annotation d'images les plus populaires en apprentissage profond. Cette méthode est préférée parce qu'elle est rentable et a une efficacité d'annotation plus élevée par rapport aux autres.
Alors que l'augmentation de l'image consiste à accroître la taille de votre ensemble de données en manipulant les données d'entraînement existantes et en aidant un modèle à mieux se généraliser à un large éventail de contextes, une
L'augmentation du niveau des boîtes englobantes crée de nouvelles données d'apprentissage en modifiant uniquement le contenu des boîtes englobantes d'une image source. Les développeurs peuvent ainsi créer des données d'entraînement mieux adaptées aux conditions de leur problème. Le processus d'augmentation des boîtes englobe quatre processus :
1. Importez les bibliothèques requises
2. Définir un pipeline d'augmentation
3. Lire les images et les boîtes englobantes à partir du disque.
4. Transmettre une image et des boîtes de délimitation au pipeline d'augmentation et recevoir des images et des boîtes augmentées.
Les boîtes englobantes sont utilisées dans divers domaines pour entraîner les algorithmes à identifier des modèles. Voici quelques domaines typiques où les boîtes englobantes sont utilisées :
Les données d'apprentissage des boîtes englobantes aident les machines à identifier les objets sur la route ou dans les rues. Ces objets comprennent les feux de signalisation, les autres véhicules, les panneaux de signalisation, les piétons et les voies. Lorsque les données d'entraînement sont extrêmement adaptables, elles aident les machines à mieux reconnaître les obstacles dans les rues et à exécuter des instructions en fonction des informations perçues.
Les boîtes englobantes peuvent également s'étendre à la reconnaissance d'objets avec la robotique et l'imagerie par drone. Par exemple, les drones peuvent détecter des toits endommagés, des unités de climatisation et la migration d'espèces, s'ils sont associés à des données d'entraînement précises et annotées. Les boîtes englobantes permettent aux robots et aux drones d'identifier facilement des objets physiques à distance.
Lorsque les maladies des plantes sont identifiées à un stade précoce, les chances de les détecter et de les prévenir à un stade précoce sont accrues. Avec l'avènement de l'agriculture intelligente, l'annotation des boîtes englobantes permet de collecter des données d'entraînement pour former des modèles de détection des maladies des plantes.
Les boîtes englobantes aident à détecter les dommages pour les réclamations d'assurance. Dans le domaine de l'assurance, les annotations des boîtes englobantes sont utilisées pour former un modèle capable d'identifier immédiatement les incidents ou accidents réguliers. Lorsqu'il y a des dégâts sur la carrosserie, le toit, les feux avant et arrière, les vitres cassées, ces défauts peuvent être identifiés par Computer Vision. Les annotations des boîtes englobantes aident les machines à évaluer l'étendue des dommages afin que les compagnies d'assurance puissent traiter correctement les demandes d'indemnisation.
Les annotations des boîtes englobantes permettent de mieux visualiser les produits dans les magasins de détail ou les boutiques en ligne. Ils peuvent reconnaître des objets tels que des produits de soins de la peau, des articles de mode, des meubles, etc. lorsqu'ils sont bien annotés. Les annotations des boîtes englobantes peuvent résoudre les problèmes suivants dans le commerce de détail : Les résultats de recherche erronés, le processus de numérisation continu et les chaînes d'approvisionnement organisées de manière chaotique.
1. Introduire le flou dans les objets
2. Rotation des objets
3. Renverser l'orientation des objets
4. Rendre les objets plus lumineux ou réduire leur luminosité
5. Recadrage des images
1. Sphère environnante (SS)
2. Boîte englobante alignée sur l'axe (AABB)
3. Boîte englobante orientée (OBB)
4. Coque pleine direction (FDH)
5. Coque convexe (CH)
Nos experts vous font part de leurs meilleures pratiques pour obtenir les annotations les plus précises possibles !
L'intersection sur l'union est une technique utilisée sur le site computer vision pour identifier et localiser des objets dans des images ou des vidéos numériques. Les annotations des boîtes englobantes sont utilisées pour atteindre cet objectif par la localisation.
Lorsqu'il y a un chevauchement excessif entre la boîte de prédiction et la boîte englobante, le modèle est incapable d'identifier l'objet ciblé dans un ensemble de données. Plus le chevauchement est faible, plus la boîte englobante est précise.
Dans l'annotation de la boîte englobante, il n'est pas conseillé de commencer par des éléments de forme diagonale. En effet, ils occupent naturellement des espaces plus petits dans la boîte englobante. Le modèle machine peut confondre l'arrière-plan réel avec l'objet ciblé, ce qui va à l'encontre de l'objectif initial de l'annotation.
Il est conseillé de se concentrer sur des objets plus petits, car ils ne laissent guère de place aux erreurs. Les images plus grandes sont moins précises lorsqu'elles sont utilisées dans des ensembles de données de boîtes englobantes.
Chaque objet d'intérêt doit être annoté, car les modèles de formation doivent tous les identifier pour obtenir des résultats précis. Une erreur catastrophique consisterait à annoter une image et à en laisser une autre. En effet, les modèles ont été construits de manière à savoir quels motifs de pixels sont conformes à un objet d'intérêt.
Les variations de taille des boîtes doivent être cohérentes. Cela est dû au fait que les objets de grande taille sont généralement moins performants dans les ensembles de données, surtout lorsque le même type d'objet semble plus petit. L'entraînement des modèles avec des objets de même taille ne leur permettra pas non plus de fonctionner à la perfection.
Pour que les pixels soient parfaitement serrés, les bords de la boîte englobante doivent toucher le plus grand nombre de pixels de l'objet annoté. Si des espaces sont laissés, un modèle peut être incapable de donner des prédictions précises.
Les objets occultés sont ceux qui ne sont pas visibles parce qu'un obstacle les empêche de l'être. Cela ne justifie pas de le laisser partiellement annoté ou complètement non annoté. Il doit être annoté tout comme les images entièrement visibles dans la boîte englobante.
Un objet d'intérêt doit être annoté de manière complète et détaillée, car une annotation partiel entraîne une confusion de la part du modèle quant à la nature réelle de l'objet.
Il est préférable d'être très précis dans les annotations plutôt que d'être général. En effet, en cas d'erreur, un site annoter très spécifique peut être ajusté ou réannoté. Toutefois, si l'annotation est générale, il sera nécessaire d'envoyer à nouveau l'ensemble des données à l'adresse annoter afin d'obtenir la précision nécessaire.
Nous disposons d'une large gamme de solutions et d'outils qui vous aideront à former vos algorithmes. Cliquez ci-dessous pour en savoir plus !