- Description :
BigEarthNet est une nouvelle archive de référence Sentinel-2 à grande échelle, composée de 590 326 patchs d'images Sentinel-2. La taille de la zone d'image au sol est de 1,2 x 1,2 km avec une taille d'image variable en fonction de la résolution du canal. Il s'agit d'un ensemble de données multi-étiquettes avec 43 étiquettes déséquilibrées.
Pour construire le BigEarthNet, 125 tuiles Sentinel-2 acquises entre juin 2017 et mai 2018 sur les 10 pays (Autriche, Belgique, Finlande, Irlande, Kosovo, Lituanie, Luxembourg, Portugal, Serbie, Suisse) d'Europe ont été initialement sélectionnées. Toutes les tuiles ont été corrigées atmosphériquement par l'outil de génération et de formatage de produits Sentinel-2 niveau 2A (sen2cor). Ensuite, ils ont été divisés en 590 326 zones d’images non superposées. Chaque parcelle d'image a été annotée par les multiples classes de couverture terrestre (c'est-à-dire multi-étiquettes) fournies par la base de données CORINE Land Cover de l'année 2018 (CLC 2018).
Bandes et résolution en pixels en mètres :
- B01 : Aérosol côtier ; 60m
- B02 : Bleu ; 10m
- B03 : vert ; 10m
- B04 : Rouge ; 10m
- B05 : Bordure rouge de la végétation ; 20m
- B06 : Bordure rouge de végétation ; 20m
- B07 : Bordure rouge de la végétation ; 20m
- B08 : NIR ; 10m
- B09 : Vapeur d'eau ; 60m
- B11 : SWIR ; 20m
- B12 : SWIR ; 20m
- B8A : NIR étroit ; 20m
Licence : Contrat de licence de données communautaires - Permissive, version 1.0.
URL : http://bigearth.net/
Documentation supplémentaire : Explorer sur les articles avec le code
Page d'accueil : http://bigearth.net
Code source :
tfds.datasets.bigearthnet.Builder
Versions :
-
1.0.0
(par défaut) : nouvelle API fractionnée ( https://tensorflow.org/datasets/splits )
-
Taille du téléchargement :
65.22 GiB
Mise en cache automatique ( documentation ) : Non
Divisions :
Diviser | Exemples |
---|---|
'train' | 590 326 |
- Citation :
@article{Sumbul2019BigEarthNetAL,
title={BigEarthNet: A Large-Scale Benchmark Archive For Remote Sensing Image Understanding},
author={Gencer Sumbul and Marcela Charfuelan and Beg{"u}m Demir and Volker Markl},
journal={CoRR},
year={2019},
volume={abs/1902.06148}
}
bigearthnet/rgb (configuration par défaut)
Description de la configuration : Canaux Sentinel-2 RGB
Taille de l'ensemble de données :
14.07 GiB
Structure des fonctionnalités :
FeaturesDict({
'filename': Text(shape=(), dtype=string),
'image': Image(shape=(120, 120, 3), dtype=uint8),
'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=43)),
'metadata': FeaturesDict({
'acquisition_date': Text(shape=(), dtype=string),
'coordinates': FeaturesDict({
'lrx': int64,
'lry': int64,
'ulx': int64,
'uly': int64,
}),
'projection': Text(shape=(), dtype=string),
'tile_source': Text(shape=(), dtype=string),
}),
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Type D | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
nom de fichier | Texte | chaîne | ||
image | Image | (120, 120, 3) | uint8 | |
Étiquettes | Séquence (ClassLabel) | (Aucun,) | int64 | |
métadonnées | FonctionnalitésDict | |||
métadonnées/date_d'acquisition | Texte | chaîne | ||
métadonnées/coordonnées | FonctionnalitésDict | |||
métadonnées/coordonnées/lrx | Tenseur | int64 | ||
métadonnées/coordonnées/lry | Tenseur | int64 | ||
métadonnées/coordonnées/ulx | Tenseur | int64 | ||
métadonnées/coordonnées/juillet | Tenseur | int64 | ||
métadonnées/projection | Texte | chaîne | ||
métadonnées/tile_source | Texte | chaîne |
Clés supervisées (Voir doc
as_supervised
) :('image', 'labels')
Figure ( tfds.show_examples ) :
- Exemples ( tfds.as_dataframe ) :
bigearthnet/tout
Description de la configuration : 13 canaux Sentinel-2
Taille de l'ensemble de données :
176.63 GiB
Structure des fonctionnalités :
FeaturesDict({
'B01': Tensor(shape=(20, 20), dtype=float32),
'B02': Tensor(shape=(120, 120), dtype=float32),
'B03': Tensor(shape=(120, 120), dtype=float32),
'B04': Tensor(shape=(120, 120), dtype=float32),
'B05': Tensor(shape=(60, 60), dtype=float32),
'B06': Tensor(shape=(60, 60), dtype=float32),
'B07': Tensor(shape=(60, 60), dtype=float32),
'B08': Tensor(shape=(120, 120), dtype=float32),
'B09': Tensor(shape=(20, 20), dtype=float32),
'B11': Tensor(shape=(60, 60), dtype=float32),
'B12': Tensor(shape=(60, 60), dtype=float32),
'B8A': Tensor(shape=(60, 60), dtype=float32),
'filename': Text(shape=(), dtype=string),
'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=43)),
'metadata': FeaturesDict({
'acquisition_date': Text(shape=(), dtype=string),
'coordinates': FeaturesDict({
'lrx': int64,
'lry': int64,
'ulx': int64,
'uly': int64,
}),
'projection': Text(shape=(), dtype=string),
'tile_source': Text(shape=(), dtype=string),
}),
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Type D | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
B01 | Tenseur | (20, 20) | flotteur32 | |
B02 | Tenseur | (120, 120) | flotteur32 | |
B03 | Tenseur | (120, 120) | flotteur32 | |
B04 | Tenseur | (120, 120) | flotteur32 | |
B05 | Tenseur | (60, 60) | flotteur32 | |
B06 | Tenseur | (60, 60) | flotteur32 | |
B07 | Tenseur | (60, 60) | flotteur32 | |
B08 | Tenseur | (120, 120) | flotteur32 | |
B09 | Tenseur | (20, 20) | flotteur32 | |
B11 | Tenseur | (60, 60) | flotteur32 | |
B12 | Tenseur | (60, 60) | flotteur32 | |
B8A | Tenseur | (60, 60) | flotteur32 | |
nom de fichier | Texte | chaîne | ||
Étiquettes | Séquence (ClassLabel) | (Aucun,) | int64 | |
métadonnées | FonctionnalitésDict | |||
métadonnées/date_d'acquisition | Texte | chaîne | ||
métadonnées/coordonnées | FonctionnalitésDict | |||
métadonnées/coordonnées/lrx | Tenseur | int64 | ||
métadonnées/coordonnées/lry | Tenseur | int64 | ||
métadonnées/coordonnées/ulx | Tenseur | int64 | ||
métadonnées/coordonnées/juillet | Tenseur | int64 | ||
métadonnées/projection | Texte | chaîne | ||
métadonnées/tile_source | Texte | chaîne |
Clés supervisées (Voir doc
as_supervised
) :None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ) :