Le projet a été réalisé avec le soutien de Lacuna Fund, le premier effort collaboratif mondial pour fournir aux data scientistes, scientifiques, chercheurs, entrepreneurs sociaux dans le pays en voie de développement les ressources dont ils ont besoin afin de produire des ensembles de données labellisés s’adressant à leurs problèmes locaux. Lacuna Fund est un fonds multi bailleurs qui inclut la Fondation Rockefeller, Google.org, l’IRDC, le GIZ, Wellcome Trust, la Fondation Gordon et Betty Moore Fondation, la Fondation Patrick J. McGovern, la Fondation Robert Wood Johnson Foundation. Plus d’information sur la page https://lacunafund.org/about/
Langue : Anglais
Format : Excel
Annotation : L’annotation provient de capture d’images satellitaire et d’images drones. Les images sont originales et ne proviennent pas de travaux préalablement réalisés.
Mise à jour : Annuellement, selon la possibilité annuelle de l’organisation.
Objectif : La Base de données a initialement pour but de développer un algorithme de détection de panneaux solaires d’où l’annotation d’images.
Lien d’accès aux images ICI
Méthodologie : Combinaison d’annotation d’images satellitaires (faible définition) et images drones (haute définition).
- Identification visuelle de panneaux solaires à l’œil nu sur des images satellites
- Vérification sur terrain de la véracité des identifications à hauteur de 25%
- Capture d’image satellite et prise d’image drones
- Annotation manuelle de chaque photos (Au total 11 154 images traitées)
Structure de la base de données : la BDD contient 3 feuilles Excel renommées Lev_1 ; Lev_2 : Lev_3
LEV_1 : elle constitue le premier niveau de description des images satellites et drones. Elle donne une description générale des images. Elle contient 20 colonnes.
- Number : numéro pour facilitation la recherche et le tri des lignes uniquement
- Img_name : la nomenclature des images satellites a été des numéros pareils qu’a colonne n°1. Pareil pour les images drones avec l’ajout de « ID » en fin de numéro. Ainsi une image drone a été nommée par exemple 3001ID, 2596ID, 5200 ID etc ….
- Img_long_East : Longitude du Point Centroide des images drone. Tous sont à l’Est.
- Img_lat_South : Latitude du Point Centroide des images drone. Tous sont au Sud.
- img_origin : Deux valeurs possible « S « pour Satellite, « D » pour image Drone
- type1 : cette colonne trie les types de matériels d’énergie solaire. Soit un chauffe-eau solaire, soit un panneau solaire. Trois valeurs possibles :
- Boil : pour une image contenant uniquement un ou des chauffe-eaux
- Pan : pour une image contenant uniquement un ou des panneaux solaires
- Mix : quand ‘image contient un ou des chauffe eaux et panneau à la fois
- Solar_park : exceptionnellement pour distinguer les parcs solaires des installations résidentielles sur les toits ou jardins ...
- elt_number : Colonne numérique. Il s’agit du nombre d’éléments identifiés dans l’image. On entend par « élément », une zone identifiée sur l’image en tant que chauffe-eau ou panneau solaire. Par exemple, si une image ne contient qu’un seul chauffe-eau, la colonne sera de 1 , si l’on a identifié deux panneaux solaires côte à côte, on aura mis 1 ou 2 ( dans cette colonne, il n’y a pas de fausse identification d’élément, car l’annotation suit une vision humaine pour déterminer une zone et le choix de l’opérateur au moment de l’annotation. L’annotation continue dans la feuille Lev_2 mais ne s’arrête pas à ce niveau) . Si la colonne 6 fut « mix » , il fut interdit de considérer ensemble comme un élément un « boil » et un « pan ».
- type2 : Dans ce Premier niveau, cette colonne est réservée pour les images drones.
Cette colonne détermine l’emplacement des éléments dans l’image du genre, sur le toit, en plein air dans le jardin, sur une fenêtre etc … Les valeurs possibles sont :
- roof : quand l’objet est installé sur le toit ou terrasse.
- openspace : quand l’objet est installé sur la cours, jardin , à l’extérieur installé par terre
- r_openspace : Quand l’image présente de(s) objets installé à la fois sur toit (roof) et à l’extérieur.
- Window : sur les fenêtres
- Park_capacity_kw : Colonne numérique. Capacité de production énergétique si la colonne « Type1 » est « solar-park ». Valeur exprimée en KWC. Données recherchées sur Google.
- Cam_alt : Colonne pour les images satellites uniquement. IL s’agit de l’altitude de la caméra satellite sur Google earth lors de la capture d’écran de l’image selon le zoom réalisé par l’opérateur. Niveau mentionné en « mètre »
- Mouse_alt : Colonne pour les images satellites uniquement. IL s’agit de l’altitude de la souris sur satellite sur Google earth lors de la cature d’écran de l’image selon le zoom réalisé par l’opérateur. Niveau mentionné en « mètre ».
- width_pixel : largeur en pixel des images. La largeur des images a été utilisée comme longitude dans la description en Lev_3
- height_pixel : hauteur en pixel des images. La hauteur des images a été utilisée comme latitude dans la description plus avancée en Lev_3
- city : ville ou Village
- region : la région ne suit pas les 22 régions mais de manière géographique. 5 valeurs possibles dont Center, North, East, West, South
- img_date : 01/07/2023 par défaut pour les images satellites et date de prise de vue pour les images drones.
- img_time : seulement pour les images drones
- img_altsea : seulement pour les images drones. Altitude des images par rapport à la mer (et non au sol)
- zoom : zoom de la caméra. Seulement pour les images drones.
- img_ISO : ISO, seulement pour les images drones.
LEV_2 : elle constitue le deuxième niveau de description des images satellites et drones. Elle donne une description plus spécifique des éléments (zones) identifiés dans le Lev_1. Elle contient 8 colonnes.
- img_name : idem que Lev_1
- elt_name : Chaque élément identifiés dans la colonne « elt_number » du Lev_1 a été renommé suivant la formule « numéro d’image + z + numéro de zone »
- Exemple : Si pour l’image 3455, le Lev_1 a mentionné « 2 » dans la colonne « elt_num » ; nous aurons 2 zones donc 3455z1 et 3455z2 rédigées sur 2 lignes différentes.
- type1 : même description que dans le Lev_1 sauf que les valeurs possibles sont uniquement le « boil » et le « pan ». Il n’y a plus de « mix ».
- type2 : Dans ce 2ème niveau, cette colonne est réservée aux images sattelites
Cette colonne détermine l’emplacement des éléments dans l’image du genre, sur le toit , en plein air dans le jardin, sur une fenêtre etc … Les valeurs possibles sont :
- roof : quand l’objet est installé sur le toit ou terrasse.
- openspace : quand l’objet est installé sur la cours, jardin , à l’exterieur installé par terre
- r_openspace : Quand l’image présente de(s) objets installé à la fois sur toit (roof) et à l’extérieur.
- Window : sur les fenêtres
- boil_nbr : Colonne numérique. Nombre de chauffe-eau de chaque élément de la colonne 2. Laissé vide si la valeur de la colonne « type1 » était du « pan ».
- pan_nbr : Colonne numérique. Nombre de panneau de chaque élément de la colonne 2. Laissé vider si la valeur de la colonne « type1 » était du « boil » ou si nous avions au la certitude que ce sont des panneaux solaires mais que la qualité ou l’éclairage de l’image rendait impossible le comptage à l’œil nu.
- pan_area : Colonne numérique. Superficie de la couverture des panneaux solaires. Valeurs uniquement pour les images satellite. Valeur exprimée en mètre carré.
- Notes : Quelques notes sur l’image tels que des identifications supplémentaires des panneaux sur une lampadaire ou des radios solaires identifiés grâce à leurs panneaux sur le toit ( par exemple) .
LEV_3 : elle constitue le troisième niveau de description des images satellites et drones. Elle donne la localisation exacte des éléments (zones) déjà décrites dans le Lev_2. Elle contient 4 colonnes.
- elt_name : Même valeur que la colonne du même nom dans le Lev_2
- edge_rank : numéros des points reliant les contours des panneaux ou des chauffe eaux. Le minimum est de 4 points pour chaque élément délimité. Le but étant de tracer les zones identifiées.
- Long : numéro de pixel de l’image sur la largeur considéré comme longitude du point. Traitement d’image sur le logiciel GIMP
- Lat : numéro de pixel de l’image sur la hauteur considéré comme latitude du point. Traitement d’image sur le logiciel GIMP
Notes : les images contenant des photos de personnes ont été floutées.