qm9

Description :

QM9 comprend les propriétés géométriques, énergétiques, électroniques et thermodynamiques calculées pour 134 000 petites molécules organiques stables composées de C, H, O, N et F. Comme d'habitude, nous supprimons les molécules non caractérisées et fournissons les 130 831 restantes.

Page d'accueil : https://doi.org/10.6084/m9.figshare.c.978904.v5
Code source : tfds.datasets.qm9.Builder
Versions :
- 1.0.0 (par défaut) : version initiale.
Taille du téléchargement : 82.62 MiB
Taille de l'ensemble de données : 177.16 MiB
Structure des fonctionnalités :

FeaturesDict({
    'A': float32,
    'B': float32,
    'C': float32,
    'Cv': float32,
    'G': float32,
    'G_atomization': float32,
    'H': float32,
    'H_atomization': float32,
    'InChI': string,
    'InChI_relaxed': string,
    'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
    'SMILES': string,
    'SMILES_relaxed': string,
    'U': float32,
    'U0': float32,
    'U0_atomization': float32,
    'U_atomization': float32,
    'alpha': float32,
    'charges': Tensor(shape=(29,), dtype=int64),
    'frequencies': Tensor(shape=(None,), dtype=float32),
    'gap': float32,
    'homo': float32,
    'index': int64,
    'lumo': float32,
    'mu': float32,
    'num_atoms': int64,
    'positions': Tensor(shape=(29, 3), dtype=float32),
    'r2': float32,
    'tag': string,
    'zpve': float32,
})

Documentation des fonctionnalités :

Fonctionnalité	Classe	Forme	Type D
	FonctionnalitésDict
UN	Tenseur		flotteur32
B	Tenseur		flotteur32
C	Tenseur		flotteur32
CV	Tenseur		flotteur32
G	Tenseur		flotteur32
G_atomisation	Tenseur		flotteur32
H	Tenseur		flotteur32
H_atomisation	Tenseur		flotteur32
InChI	Tenseur		chaîne
InChI_relaxé	Tenseur		chaîne
Mulliken_charges	Tenseur	(29,)	flotteur32
SOURIRES	Tenseur		chaîne
SMILES_détendu	Tenseur		chaîne
U	Tenseur		flotteur32
U0	Tenseur		flotteur32
U0_atomisation	Tenseur		flotteur32
U_atomisation	Tenseur		flotteur32
alpha	Tenseur		flotteur32
frais	Tenseur	(29,)	int64
fréquences	Tenseur	(Aucun,)	flotteur32
écart	Tenseur		flotteur32
homo	Tenseur		flotteur32
indice	Tenseur		int64
lumo	Tenseur		flotteur32
mu	Tenseur		flotteur32
num_atomes	Tenseur		int64
postes	Tenseur	(29, 3)	flotteur32
r2	Tenseur		flotteur32
étiqueter	Tenseur		chaîne
zpve	Tenseur		flotteur32

Clés supervisées (Voir doc as_supervised ) : None
Figure ( tfds.show_examples ) : non pris en charge.
Citation :

@article{ramakrishnan2014quantum,
  title={Quantum chemistry structures and properties of 134 kilo molecules},
  author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
  journal={Scientific Data},
  volume={1},
  year={2014},
  publisher={Nature Publishing Group}
}

qm9/original (configuration par défaut)

Description de la config : QM9 ne définit aucun split. Ainsi, cette variante place l'ensemble de données QM9 complet dans la répartition du train, dans l'ordre d'origine (pas de brassage).
Mise en cache automatique ( documentation ) : uniquement lorsque shuffle_files=False (train)
Divisions :

Diviser	Exemples
`'train'`	130 831

Exemples ( tfds.as_dataframe ) :

qm9/cormoran

Description de la configuration : Division de l'ensemble de données utilisée par Cormorant. 100 000 trains, 17 748 validations et 13 083 échantillons de test. Le fractionnement se produit après le mélange avec la graine 0. Papier : https://arxiv.org/abs/1906.04015 Fractionnement : https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
Mise en cache automatique ( documentation ) : Oui (test, validation), Uniquement lorsque shuffle_files=False (train)
Divisions :

Diviser	Exemples
`'test'`	13 083
`'train'`	100 000
`'validation'`	17 748

Exemples ( tfds.as_dataframe ) :

qm9/dimenet

Description de la configuration : Division de l'ensemble de données utilisée par DimeNet. 110 000 trains, 10 000 validations et 10 831 échantillons de test. Le fractionnement se produit après le mélange avec la graine 42. Papier : https://arxiv.org/abs/2003.03123 Fractionnement : https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
Mise en cache automatique ( documentation ) : Oui (test, validation), Uniquement lorsque shuffle_files=False (train)
Divisions :

Diviser	Exemples
`'test'`	10 831
`'train'`	110 000
`'validation'`	10 000

Exemples ( tfds.as_dataframe ) :

qm9 Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

qm9/original (configuration par défaut)

qm9/cormoran

qm9/dimenet

qm9