mq9

Descrizione :

QM9 consiste nel calcolo delle proprietà geometriche, energetiche, elettroniche e termodinamiche per 134.000 piccole molecole organiche stabili costituite da C, H, O, N e F. Come al solito, rimuoviamo le molecole non caratterizzate e forniamo le restanti 130.831.

Pagina iniziale : https://doi.org/10.6084/m9.figshare.c.978904.v5
Codice sorgente : tfds.datasets.qm9.Builder
Versioni :
- 1.0.0 (impostazione predefinita): versione iniziale.
Dimensione download : 82.62 MiB
Dimensione del set di dati : 177.16 MiB
Struttura delle caratteristiche :

FeaturesDict({
    'A': float32,
    'B': float32,
    'C': float32,
    'Cv': float32,
    'G': float32,
    'G_atomization': float32,
    'H': float32,
    'H_atomization': float32,
    'InChI': string,
    'InChI_relaxed': string,
    'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
    'SMILES': string,
    'SMILES_relaxed': string,
    'U': float32,
    'U0': float32,
    'U0_atomization': float32,
    'U_atomization': float32,
    'alpha': float32,
    'charges': Tensor(shape=(29,), dtype=int64),
    'frequencies': Tensor(shape=(None,), dtype=float32),
    'gap': float32,
    'homo': float32,
    'index': int64,
    'lumo': float32,
    'mu': float32,
    'num_atoms': int64,
    'positions': Tensor(shape=(29, 3), dtype=float32),
    'r2': float32,
    'tag': string,
    'zpve': float32,
})

Documentazione delle funzionalità :

Caratteristica	Classe	Forma	Tipo D
	CaratteristicheDict
UN	Tensore		float32
B	Tensore		float32
C	Tensore		float32
Cv	Tensore		float32
G	Tensore		float32
G_atomizzazione	Tensore		float32
H	Tensore		float32
H_atomizzazione	Tensore		float32
InChI	Tensore		corda
InChI_rilassato	Tensore		corda
Mulliken_charges	Tensore	(29,)	float32
SORRISI	Tensore		corda
SORRISI_rilassato	Tensore		corda
U	Tensore		float32
U0	Tensore		float32
U0_atomizzazione	Tensore		float32
U_atomizzazione	Tensore		float32
alfa	Tensore		float32
spese	Tensore	(29,)	int64
frequenze	Tensore	(Nessuno,)	float32
spacco	Tensore		float32
omo	Tensore		float32
indice	Tensore		int64
lumo	Tensore		float32
mu	Tensore		float32
num_atomi	Tensore		int64
posizioni	Tensore	(29, 3)	float32
r2	Tensore		float32
etichetta	Tensore		corda
zpve	Tensore		float32

Chiavi supervisionate (vedi il documento as_supervised ): None
Figura ( tfds.show_examples ): non supportato.
Citazione :

@article{ramakrishnan2014quantum,
  title={Quantum chemistry structures and properties of 134 kilo molecules},
  author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
  journal={Scientific Data},
  volume={1},
  year={2014},
  publisher={Nature Publishing Group}
}

qm9/originale (configurazione predefinita)

Descrizione della configurazione : QM9 non definisce alcuna suddivisione. Quindi questa variante inserisce l'intero set di dati QM9 nella suddivisione del treno, nell'ordine originale (senza mescolamento).
Memorizzazione nella cache automatica ( documentazione ): solo quando shuffle_files=False (train)
Divide :

Diviso	Esempi
`'train'`	130.831

Esempi ( tfds.as_dataframe ):

qm9/cormorano

Descrizione configurazione : suddivisione del set di dati utilizzata da Cormorant. 100.000 treni, 17.748 convalide e 13.083 campioni di prova. La divisione avviene dopo aver mescolato con il seme 0. Documento: https://arxiv.org/abs/1906.04015 Divisione: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
Memorizzazione nella cache automatica ( documentazione ): Sì (test, convalida), solo quando shuffle_files=False (train)
Divide :

Diviso	Esempi
`'test'`	13.083
`'train'`	100.000
`'validation'`	17.748

Esempi ( tfds.as_dataframe ):

qm9/dimenet

Descrizione configurazione : suddivisione del set di dati utilizzata da DimeNet. 110.000 treni, 10.000 convalide e 10.831 campioni di prova. La divisione avviene dopo aver mescolato con il seme 42. Documento: https://arxiv.org/abs/2003.03123 Divisione: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
Memorizzazione nella cache automatica ( documentazione ): Sì (test, convalida), solo quando shuffle_files=False (train)
Divide :

Diviso	Esempi
`'test'`	10.831
`'train'`	110.000
`'validation'`	10.000

Esempi ( tfds.as_dataframe ):

mq9 Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

qm9/originale (configurazione predefinita)

qm9/cormorano

qm9/dimenet

mq9