- Descrição :
QM9 consiste em propriedades geométricas, energéticas, eletrônicas e termodinâmicas computadas para 134k pequenas moléculas orgânicas estáveis compostas de C, H, O, N e F. Como de costume, removemos as moléculas não caracterizadas e fornecemos as 130.831 restantes.
Página inicial : https://doi.org/10.6084/m9.figshare.c.978904.v5
Código fonte :
tfds.datasets.qm9.Builder
Versões :
-
1.0.0
(padrão): versão inicial.
-
Tamanho do download :
82.62 MiB
Tamanho do conjunto de dados :
177.16 MiB
Estrutura de recursos :
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- Documentação de recursos :
Recurso | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
A | Tensor | float32 | ||
B | Tensor | float32 | ||
C | Tensor | float32 | ||
Cv | Tensor | float32 | ||
G | Tensor | float32 | ||
G_atomização | Tensor | float32 | ||
H | Tensor | float32 | ||
H_atomização | Tensor | float32 | ||
InChI | Tensor | corda | ||
InChI_relaxado | Tensor | corda | ||
Mulliken_cargas | Tensor | (29,) | float32 | |
SORRISOS | Tensor | corda | ||
SMILES_relaxado | Tensor | corda | ||
você | Tensor | float32 | ||
U0 | Tensor | float32 | ||
U0_atomização | Tensor | float32 | ||
U_atomização | Tensor | float32 | ||
alfa | Tensor | float32 | ||
cobranças | Tensor | (29,) | int64 | |
frequências | Tensor | (Nenhum,) | float32 | |
brecha | Tensor | float32 | ||
homo | Tensor | float32 | ||
índice | Tensor | int64 | ||
lumo | Tensor | float32 | ||
mu | Tensor | float32 | ||
num_atoms | Tensor | int64 | ||
posições | Tensor | (29, 3) | float32 | |
r2 | Tensor | float32 | ||
marcação | Tensor | corda | ||
zpve | Tensor | float32 |
Chaves supervisionadas (consulte o documento
as_supervised
):None
Figura ( tfds.show_examples ): Não suportado.
Exemplos ( tfds.as_dataframe ): Ausente.
Citação :
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/original (configuração padrão)
Descrição da configuração : QM9 não define nenhuma divisão. Portanto, esta variante coloca o conjunto de dados QM9 completo na divisão do trem, na ordem original (sem embaralhamento).
Armazenado em cache automaticamente ( documentação ): somente quando
shuffle_files=False
(train)Divisões :
Dividir | Exemplos |
---|---|
'train' | 130.831 |
qm9/corvo marinho
Descrição da configuração : divisão do conjunto de dados usada pelo Cormorant. 100.000 trens, 17.748 validações e 13.083 amostras de teste. A divisão acontece após embaralhar com a semente 0. Artigo: https://arxiv.org/abs/1906.04015 Divisão: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
Armazenado em cache automaticamente ( documentação ): Sim (teste, validação), Somente quando
shuffle_files=False
(trem)Divisões :
Dividir | Exemplos |
---|---|
'test' | 13.083 |
'train' | 100.000 |
'validation' | 17.748 |
qm9/dimenet
Descrição da configuração : divisão do conjunto de dados usada pela DimeNet. 110.000 trens, 10.000 validações e 10.831 amostras de teste. A divisão acontece após embaralhar com a semente 42. Artigo: https://arxiv.org/abs/2003.03123 Divisão: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
Armazenado em cache automaticamente ( documentação ): Sim (teste, validação), Somente quando
shuffle_files=False
(trem)Divisões :
Dividir | Exemplos |
---|---|
'test' | 10.831 |
'train' | 110.000 |
'validation' | 10.000 |